Scala(2.12)之collection基本操作
map源码
//第一个参数传入一个函数,第二个参数为隐式参数,返回值和集合的类型一致都是B
def map[B, That](f: A => B)(implicit bf: CanBuildFrom[Repr, B, That]): That = {
//方法内部定义builder方法
def builder = { // extracted to keep method size under 35 bytes, so that it can be JIT-inlined
//调用repr方法
val b = bf(repr)
b.sizeHint(this)
b
}
//将上述builder方法的返回值赋值给b
val b = builder
for (x <- this) b += f(x)
//调用result方法,返回一个集合
b.result
}
总结:
1)map方法将某个函数应用到集合中的每个元素,并产生一个新集合。 2)新产生集合的个数等于原集合的个数,个数大于原元素就会形成集合嵌套 3)元素(eg:String)应用到map方法传递的函数(eg elem=>elem.split(""))后产生的元素大于原元素,此时生成一个集合,最后形成一个集合嵌套 4)进行map的对象是只含一层的集合
flatten:没有源码分析后续补充
总结
1)使用没用参数; 2)String最终会被扁平化到字符 3)返回的是集合 4)进行flatten的对象是可以嵌套的的集合
flatmap
总结
1)输入什么集合,返回什么集合 2)flatmap方法传递的函数的参数是字符串 3)flatMap返回的个数则是不同与原集合个数 4)flatMap = map + flatten 即先对集合中的每个元素进行map,再对map后的每个元素(map后的每个元素必须还是集合)中的每个元素进行flatten 5)进行map的对象可以是只含一层的集合,但进行flatten操作的对象必需是至少含两层的集合
filter : filter方法可以对集合中的每一条数据进行筛选过滤
总结
1)输入什么类型集合,返回什么类型集合 2)满足条件(true)的数据保留,不满足条件(false)的数据丢弃
groupby
源码分析
def groupBy[K](f: A => K): immutable .Map [K,, Repr] = {
//创建一个可变map对象m->【k:K v:mutable.Bulder[A,Repr]】
//Bulder 元素为A,构建类型为Repr,它可以通过+=来向构造器中添加元素,通过result返回得到一个任意类型的集合
val m: mutable.Map[K, mutable.Builder[A, Repr]] = mutable.Map.empty[K, Builder[Aj Repr]]
//遍历集合,向m中添加元素,key为传过来的集合中的元素通过函数f()计算返回的结果,
//如果该key是在m中没有,则创建一个元素类型为A,构建类型为Repr的Builder对象放入value中,
//并让bldr指向该Builder对象,向bldr中添加元素elem(事实上是向m的value中添加elem)
/*
举例: 第一次f()计算结果是1,elem是"a",由于是第一次,则创建新的Builder给V,
此时m = (1 -> (“a”)),第二次f()计算结果还是1,elem是"b",
此时m=(1 ->(“a”,“b”)),第三次f()计算结果变成2了,elem是"c",
由于key->2第一次出现,则创建新的Builder,此时m=(1 ->(“a”,“b”),2 -> (“c”))
*/
for (elem <- this) {
val key: K = f(elem)
val bldr: mutable.Builder[A, Repr] = m.getOrElseUpdate(key, newBuilder) bldr += elem
}
//创建一个构造器b,元素类型是Tupple2(K,Repr),构建类型是Map(K,Repr),遍历m,
//向b中添加k和v,将m的数据导入到构造器b中 调用result输出集合
val b: mutable.Builder[(K, Repr), Map[K, Repr]] = immutable.Map.newBuilder[K,, Repr]
for ((k, v) <- m)
b += ((k, v.result))
b.result
总结
1) groupBy传入的参数f(A)=>K, A为调用函数的集合元素类型,K为输出map的key。 2) 输出map的value类型为调用函数的集合的类型
sortby
源码
//sortBy最后也是调用的sorted方法,隐式参数Ordering作用混入了Java的Comparator接口
//提供一个外部比较器
def sortBy[B](f: A => B)(implicit ord: Ordering[B]): Repr = sorted(ord on f)
//sorted源码
def sorted[B >: A](implicit ord: Ordering[B]): Repr = {
val len = this.length
val arr = new ArraySeq[A](len)
var i = 0
for (x <- this.seq) {
arr(i) = x
i += 1
}
//sorted方法真正排序的逻辑是调用的java.util.Arrays.sort
//java中的sort用快速排序和优化的归并排序
//快速排序主要是对那些基本类型数据(int,short,long等)排序, 而归并排序用于对Object类型进行排序。
java.util.Arrays.sort(arr.array, ord.asInstanceOf[Ordering[Object]])
val b = newBuilder
b.sizeHint(len)
for (x <- arr) b += x
b.result
}
总结
java sort总结: 1)首先先判断需要排序的数据量是否大于60。 2)小于60:使用插入排序,插入排序是稳定的 3)大于60的数据量会根据数据类型选择排序方式: 基本类型:使用快速排序。因为基本类型。1、2都是指向同一个常量池不需要考虑稳定性。 Object类型:使用归并排序。因为归并排序具有稳定性。 4)注意:不管是快速排序还是归并排序。在二分的时候小于60的数据量依旧会使用插入排序 scala sort总结: 1)升序默认 2)"Hello Scala" compare "Hello React" 第一个单词首字母相同,比较第二个单词首字母 3) Ordering.Int.reverse;隐式参数Ordering来做倒序排序
mapValues 2.13scala已经弃用
总结
1)处理什么集合,返回什么集合 Let's say we have a Map[A,B]. For clarification: I'm always referring to an immutable Map. mapValues takes a function B => C, where C is the new type for the values.
本文为原创文章,转载请标明出处

浙公网安备 33010602011771号