摘要: map是对每个元素操作, mapPartitions是对其中的每个partition操作 mapPartitionsWithIndex : 把每个partition中的分区号和对应的值拿出来, 看源码 val func = (index: Int, iter: Iterator[(Int)]) => 阅读全文
posted @ 2018-11-09 11:42 马小纪 阅读(143) 评论(0) 推荐(0) 编辑
摘要: Spark笔记 1. flatMap和map的区别 map函数会对每一条输入进行指定的操作,然后每一条输入返回一个对象; flatMap函数则是两个操作的集合,即先映射再扁平化: i.同map函数一样,对每一条输入进行指定的操作,然后为每一条输入返回一个对象; ii.然后将所有对象合并成一个对象。 阅读全文
posted @ 2018-11-09 10:13 马小纪 阅读(368) 评论(2) 推荐(0) 编辑