摘要:
Spark中最核心的概念为 RDD(Resilient Distributed DataSets) 中文为: 弹性分布式数据集 ,RDD为对分布式内存对象的 抽象它表示一个 被分区不可变 且能 并行操作 的数据集;RDD为可序列化的、可缓存到内存对RDD进行操作过后还可以存到内存中,下次操作直接把内... 阅读全文
posted @ 2016-01-09 17:31
AiFly
阅读(589)
评论(0)
推荐(0)
浙公网安备 33010602011771号