摘要: 1 概念 2 安装 3 RDD RDD包含两种基本的类型:Transformation和Action。RDD的执行是延迟执行,只有Action算子才会触发任务的执行。 宽依赖和窄依赖用于切分任务,如果都是窄依赖,那么就可以最大化的利用并行。 常用操作: cache 缓存 cartesian 笛卡尔积 阅读全文
posted @ 2017-06-14 19:03 xingoo 阅读(1994) 评论(0) 推荐(0) 编辑