摘要:
RDD是一个抽象类定义了所有RDD共有的一些属性和方法,下面介绍了主要的属性和方法。 RDD有5个主要的属性 (一)子类 (二)属性 1、SpackContext 在主构建函数中定义,表示RDD所在运行环境,可用于获取配置,清理环境等。 2、Seq[Dependency[_]] 定义了这个RDD对父 阅读全文
posted @ 2017-04-06 14:11
大葱拌豆腐
阅读(616)
评论(0)
推荐(0)
摘要:
RDD根据对父RDD的依赖关系,可分为窄依赖与宽依赖2种。 主要的区分之处在于父RDD的分区被多少个子RDD分区所依赖,如果一个就为窄依赖,多个则为宽依赖。更好的定义应该是: 窄依赖的定义是子RDD的每一个分区都依赖于父RDD的一个或者少量几个分区(不依赖于全部分区) 与依赖相关的以下5个类: 它们 阅读全文
posted @ 2017-04-06 13:37
大葱拌豆腐
阅读(3025)
评论(0)
推荐(0)
浙公网安备 33010602011771号