Scala(五)【集合的高级使用】

一.集合属性

size

获取集合的大小

list.size
length

获取集合的长度

list.length
contains

是否包含

val list = List[Int](3,7,2,9,10)
list.contains(100
mkString

转字符串,参数是元素的分隔符。

val list = List(1, 2, 3, 4)
println(list.mkString("-"))//结果:1-2-3-4

二.集合方法

drop、dropRight

删除前[后]多少个元素,保留剩下的元素

val list1 = list.drop(3)
val list2 = list.dropRight(3)
distinct:去重
head、last:获取第一个、最后一个元素
tail、init:去除第一个元素剩余的所有元素、去除最后一个元素剩余的所有元素、
isEmpty:是否为空
intersect、diff、union:交集、差集、并集
max、min:最大、最小值
sum:求和
reverse:反转
sliding(窗口长度,滑动步长)
tail:除开最后一个元素,返回剩余元素组成的集合
take(n):获取前多少个元素,TopN
求集合交集、并集、差集:intersect,diff,union
zip:拉链
val list14 = List[String]("name","age","address","sex","aa")
val list15 = List[Any]("zhangsan",20,"shenzhen","男")
val list16 = list14.zip(list15)
println(list16)// List((name,zhangsan), (age,20), (address,shenzhen), (sex,男))
unzip:反拉链

返回一个二元元祖,2个List

//list16:((name,zhangsan), (age,20), (address,shenzhen), (sex,男))
val list17 = list16.unzip 
println(list17)//(List(name, age, address, sex),List(zhangsan, 20, shenzhen, 男))
sorted:升序
//排序,升序
val list1 = list.sorted
//降序
val list2 = list.sorted.reverse
sortBy:指定排序条件

默认升序

 val list3 = List[(String,Int)]( ("zhangsan",20),("lisi",30),("wangwu",15),("zhaoliu",5) )
val list = list3.sortBy(_._1)
sortWith:自定义升降序
// 函数体中< 代表是升序  >代表是降序
val list5 = list3.sortWith((x,y)=>x._2<y._2)
//升序
val list7 = list3.sortWith(_._2<_._2)
println(list7)//List((zhaoliu,5), (wangwu,15), (zhangsan,20), (lisi,30))
//降序
val list6 = list3.sortWith((x,y)=>x._2>y._2)
println(list6)//List((lisi,30), (zhangsan,20), (wangwu,15), (zhaoliu,5))

三.集合的高级函数(重要)

map:转换(一对一)

对list每个元素都执行一次,返回一个新的list

val list8 = List[String]("hello","word","python","hadoop")
val list9 = list8.map(x=>x.length)//List(5, 4, 6, 6)

class Person(val name:String,val age:Int)
val list10 = List[(String,Int)]( ("zhangsan",20),("lisi",50),("wangwu",60))
val list11 = list10.map(x=> new Person(x._1,x._2))//List(对象一,对象二,对象三)
flatten:压平(一对多)

只压第二层

val list12 = List[List[String]] ( List("scala","python"),List("hadoop","flume","kafka") )
val list13 = list12.flatten////List("scala","python","hadoop","flume","kafka")
//string也属于Seq,可以被压平成字符
val list16 = List[String]("hello spark","hello scala")
val list17 = list16.flatten
println(list17) //List(h, e, l, l, o,  , s, p, a, r, k, h, e, l, l, o,  , s, c, a, l, a)
flatMap:转换+压平(一对多)

等价于先map,再flatten

val list16 = List[String]("hello python","hello scala","hadoop flume")
val list17 = list16.map(x=>x.split(" ")).flatten
println(list17)//List(hello, spark, hello, scala)
groupBy:(多对一)

根据自定义的规则进行分组,分组后的结果是一个Map,key是分组的条件,value是一个List

    val list = List(("Shenczhen", "zhagnsan", 20), ("guangzhou", "lisi", 10), ("Shenczhen", "wangwu", 30), ("Shenczhen", "zhaoliu", 20), ("chengdu", "wuqi", 10))
    val map: Map[(String, Int), List[(String, String, Int)]] = list.groupBy(x => {
      (x._1, x._3)
    })
    println(map) //Map((Shenczhen,30) -> List((Shenczhen,wangwu,30)),
                //(chengdu,10) -> List((chengdu,wuqi,10)), 
               // (guangzhou,10) -> List((guangzhou,lisi,10)),...)
reduce:聚合(多对一)

迭代计算,本次计算的结果作为下次计算的输出

sum默认给的是集合的第一个值,然后从第二个元素开始遍历

从左往右

val list1 = List(1, 2, 3, 4)
val s = list1.reduce((sum, x)=>sum+x)
println(s)
flod(初始值)(函数):叠加(多对一)

从左往右

sum默认给的是集合的第一个括号参数的值,然后从第一个元素开始遍历

val i = list1.fold(0)((sum,x)=>sum+x)
println(i)
println(i)
filter

过滤,判断条件为True保留,返回过滤后的List集合

//找出集合中的偶数
val list1 = List(1, 2, 3, 4, 5)
val listfilter =list1.filter(x => {
   x % 2 == 0
})
println(listfilter)//List(2, 4)
posted @ 2020-07-27 21:06  来自遥远的水星  阅读(208)  评论(0编辑  收藏  举报