摘要: groupByKey,group,reduceByKey,foldByKey,aggregateByKey 都可以算作聚合类算子。 聚合类算子,在map side端产生结果后,把结果保留在本地buffer中,如果满了或者这个节点的这次RDD任务执行完了,就会把结果刷新到磁盘上给下游的task,也就是 阅读全文
posted @ 2021-12-12 17:58 习惯了蓝 阅读(269) 评论(0) 推荐(0)