Spark技术内幕:Storage 模块整体架构
摘要:
Storage模块负责了Spark计算过程中所有的存储,包括基于Disk的和基于Memory的。用户在实际编程中,面对的是RDD,可以将RDD的数据通过调用org.apache.spark.rdd.RDD#cache将数据持久化;持久化的动作都是由Storage模块完成的。包括Shuffle过程中... 阅读全文
posted @ 2015-01-18 19:13 wu2198 阅读(201) 评论(0) 推荐(0)
浙公网安备 33010602011771号