摘要: 【rdd 惰性执行】 为了提高计算效率 spark 采用了哪些机制 1-rdd 基于分布式内存数据集进行运算 2-lazy evaluation :惰性执行,即rdd的变换操作并不是在运行该代码时立即执行,而仅记录下转换操作的对象;只有当运行到一个行动代码时,变换操作的计算逻辑才真正执行。 http 阅读全文
posted @ 2017-07-05 09:47 papering 阅读(480) 评论(0) 推荐(0)