打赏
摘要: Spark本身是基于内存计算的架构,数据的存储也主要分为内存和磁盘两个路径。Spark本身则根据存储位置、是否可序列化和副本数目这几个要素将数据存储分为多种存储级别。此外还可选择使用Tachyon来管理内存数据。 为了适应迭代计算,Spark将经常被重要的数据缓存到内存中以提升数据读取速度,当内存容 阅读全文
posted @ 2016-12-16 09:36 大数据和AI躺过的坑 阅读(2067) 评论(0) 推荐(0)