java/Java Pyton 大数据 Hadoop Spark

摘要: 在使用Spark SQL的过程中,经常会用到groupBy这个函数进行一些统计工作。但是会发现除了groupBy外,还有一个groupByKey( 注意RDD也有一个groupByKey,而这里的groupByKey是DataFrame的 )。这个groupByKey引起了我的好奇,那我们就到源码里 阅读全文
posted @ 2018-11-04 16:28 zzzzMing 阅读(2030) 评论(0) 推荐(0) 编辑