摘要: 首发于我的个人博客:Spark面试题(二) 1、Spark有哪两种算子? Transformation(转化)算子和Action(执行)算子。 2、Spark有哪些聚合类的算子,我们应该尽量避免什么类型的算子? 在我们的开发过程中,能避免则尽可能避免使用reduceByKey、join、distin 阅读全文
posted @ 2021-10-28 22:05 大数据技术派 阅读(405) 评论(0) 推荐(0)