spark RDD中transformation的lazy特性深度解析和手动证明--(视频笔记)

lazy在action执行前是不会进行计算的,只是记录下当前要做的事情。
action结果会返回给driver
可以避免产生各种众多的中间数据

spark lazy 配置验证,是否是完全不执行,
可以在shell节点使用一个不存在的hdfs文件路径来创建RDD尝试,如果不报错,则说明没执行
如果报错了,则说明执行了,或者说只执行了基本校验。问题,现在是报错了!!!!,是不是新版本有修改?

posted @ 2015-12-28 19:28  逸新  阅读(760)  评论(0编辑  收藏  举报