基本数据结构
Scala 提供了一些不错的集合。
参考 Effective Scala 对怎样使用集合的观点。
数组 (Array)
数组是有序的,可以包含重复项,并且可变。
1 | scala> val numbers = Array(1, 2, 3, 4, 5, 1, 2, 3, 4, 5) |
列表 (List)
列表是有序的,可以包含重复项,不可变。
1 | scala> val numbers = List(1, 2, 3, 4, 5, 1, 2, 3, 4, 5) |
集合 (Set)
集合无序且不可包含重复项。
1 | scala> val numbers = Set(1, 2, 3, 4, 5, 1, 2, 3, 4, 5) |
元组 (Tuple)
元组在不使用类的情况下,将元素组合起来形成简单的逻辑集合。
1 | scala> val hostPort = ("localhost", 80) |
与样本类不同,元组不能通过名称获取字段,而是使用位置下标来读取对象;而且这个下标基于 1
,而不是基于 0。
1 | scala> hostPort._1 |
元组可以很好得与模式匹配相结合。
1 | hostPort match { |
在创建两个元素的元组时,可以使用特殊语法:->
1 | scala> 1 -> 2 |
参考 Effective Scala 对 解构绑定(“拆解”一个元组)的观点。
映射 (Map)
它可以持有基本数据类型。
1 | Map(1 -> 2) |
这看起来像是特殊的语法,不过不要忘了上文讨论的 ->
可以用来创建二元组。
Map() 方法也使用了从第一节课学到的变参列表:Map(1 -> “one”, 2 -> “two”) 将变为 Map((1, “one”), (2, “two”)),其中第一个元素是映射的键,第二个元素是映射的值。
映射的值可以是映射甚至是函数
。
1 | Map(1 -> Map("foo" -> "bar")) |
选项 (Option)
Option 是一个表示有可能包含值的容器。
Option 基本的接口是这样的:
1 | trait Option[T] { |
Option 本身是泛型的,并且有两个子类: Some[T]
或 None
我们看一个使用 Option 的例子:
Map.get
使用 Option 作为其返回值,表示这个方法也许不会返回你请求的值。
1 | scala> val numbers = Map("one" -> 1, "two" -> 2) |
现在我们的数据似乎陷在 Option 中了,我们怎样获取这个数据呢?
直觉上想到的可能是基于 isDefined
方法进行条件判断。
1 | // We want to multiply the number by two, otherwise return 0. |
我们建议使用 getOrElse
或模式匹配处理这个结果。
getOrElse
让你轻松地定义一个默认值。
1 | val result = res1.getOrElse(0) * 2 |
参考 Effective Scala 对使用 Options 的意见。
函数组合子(Functional Combinators)
List(1, 2, 3) map squared 对列表中的每一个元素都应用了 squared 平方函数,并返回一个新的列表 List(1, 4, 9)。我们把类似于 map 的操作称作组合子。 (如果想要更好的定义,你可以看看 Stackoverflow 上对 组合子 的说明。)他们常被用在标准的数据结构上。
map
map
对列表中的每个元素应用一个函数,返回应用后的元素所组成的列表。
1 | scala> val numbers = List(1, 2, 3, 4) |
或传入一个函数 (Scala 编译器自动把我们的方法转换为函数)
1 | scala> def timesTwo(i: Int): Int = i * 2 |
foreach
foreach
很像 map,但没有返回值
。foreach 仅用于有副作用 side-effects
的函数。
1 | scala> numbers.foreach((i: Int) => i * 2) |
你可以尝试存储返回值,但它会是 Unit
类型(即 void)
1 | scala> val doubled = numbers.foreach((i: Int) => i * 2) |
filter
filter
移除任何对传入函数计算结果为 false
的元素。返回一个布尔值的函数通常被称为谓词函数
(或判定函数)。
1 | scala> numbers.filter((i: Int) => i % 2 == 0) |
zip
zip
将两个列表的内容聚合到一个对偶列表
中。
1 | scala> List(1, 2, 3).zip(List("a", "b", "c")) |
partition
partition
将使用给定的谓词函数分割列表。
1 | scala> val numbers = List(1, 2, 3, 4, 5, 6, 7, 8, 9, 10) |
find
find
返回集合中第一个匹配谓词函数的元素。
1 | scala> numbers.find((i: Int) => i > 5) |
drop & dropWhile
drop
将删除前 i
个元素
1 | scala> numbers.drop(5) |
dropWhile
将删除匹配谓词函数的第一个
元素。例如,如果我们在 numbers 列表上使用 dropWhile 函数来去除奇数,1 将被丢弃(但 3 不会被丢弃,因为他被 2 保护了)。
1 | scala> numbers.dropWhile(_ % 2 != 0) |
foldLeft
1 | scala> numbers.foldLeft(0)((m: Int, n: Int) => m + n) |
0 为初始值(记住 numbers 是 List[Int] 类型),m 作为一个累加器。在标准库的实现为:
1 | def foldLeft[B](z: B)(op: (B, A) => B): B = { |
可视化观察运行过程:
1 | scala> numbers.foldLeft(0) { (m: Int, n: Int) => println("m: " + m + " n: " + n); m + n } |
foldRight
和 foldLeft 一样,只是运行过程相反。在标准库的实现为:
1 | def foldRight[B](z: B)(op: (A, B) => B): B = |
1 | scala> numbers.foldRight(0) { (m: Int, n: Int) => println("m: " + m + " n: " + n); m + n } |
flatten
flatten
将嵌套结构扁平化一个层级。
1 | scala> List(List(1, 2), List(3, 4)).flatten |
flatMap
flatMap
是一种常用的组合子,结合映射 mapping
和扁平化 flattening
。 flatMap
需要一个处理嵌套列表的函数,然后将结果串连起来。
1 | scala> val nestedNumbers = List(List(1, 2), List(3, 4)) |
可以把它看做是“先映射后扁平化”的快捷操作:
1 | scala> nestedNumbers.map((x: List[Int]) => x.map(_ * 2)).flatten |
这个例子先调用 map
,然后调用 flatten
,这就是 组合子
的特征,也是这些函数的本质。
参考 Effective Scala 对 flatMap 的意见。
扩展函数组合子
现在我们已经学过集合上的一些函数。
我们将尝试写自己的函数组合子。
有趣的是,上面所展示的每一个函数组合子都可以用 fold 方法实现。让我们看一些例子。
1 | def ourMap(numbers: List[Int], fn: Int => Int): List[Int] = { |
为什么是 List[Int]()
?Scala 没有聪明到理解你的目的是将结果积聚在一个空的 Int 类型的列表中。
Map?
所有展示的函数组合子都可以在 Map 上使用。Map 可以被看作是一个二元组的列表,所以你写的函数要处理一个键和值的二元组。
1 | scala> val extensions = Map("steve" -> 100, "bob" -> 101, "joe" -> 201) |
现在筛选出电话分机号码低于 200 的条目。
1 | scala> extensions.filter((namePhone: (String, Int)) => namePhone._2 < 200) |
因为参数是元组,所以你必须使用位置获取器来读取它们的键和值。呃!
幸运的是,我们其实可以使用模式匹配更优雅地提取键和值。
1 | scala> extensions.filter({case (name, extension) => extension < 200}) |
为什么这个代码可以工作?为什么你可以传递一个部分模式匹配?下一章将揭晓。