理解Spark的RDD
摘要:
RDD是个抽象类,定义了诸如map()、reduce()等方法,但实际上继承RDD的派生类一般只要实现两个方法:def getPartitions: Array[Partition]def compute(thePart: Partition, context: TaskContext): Next... 阅读全文
posted @ 2014-11-23 20:57 白乔 阅读(238) 评论(0) 推荐(0)
posted @ 2014-11-23 20:57 白乔 阅读(238) 评论(0) 推荐(0)
posted @ 2014-11-23 18:14 白乔 阅读(210) 评论(0) 推荐(0)
posted @ 2014-11-23 15:14 白乔 阅读(170) 评论(0) 推荐(0)