2015年11月15日

摘要: Spark最为重要的特性之一就是可以在多个操作(Action)之间,将一个或多个RDD关联的数据集(Dataset)以分区(Partition)为单位进行持久化(Persist)或缓存(Cache),存储介质通常是内存(Memory)。被持久化或缓存的RDD A可以在两种情况下被很好地“重复”利用:... 阅读全文
posted @ 2015-11-15 12:41 萌猫他爸 阅读(2917) 评论(0) 推荐(2) 编辑