摘要: 1.基于数据集的处理:从物理存储上加载数据,然后操作数据,然后写入数据到物理设备; 基于数据集的操作不适应的场景:不适合于大量的迭代:不适合交互式查询:每次查询都需要对磁盘进行交互.基于数据流的方式不能够复用曾经的结果或者中间的结果;2. RDD弹性数据集特点: A)自动的进行内存和磁盘数据的... 阅读全文
posted @ 2016-01-17 21:41 曹振华 阅读(665) 评论(0) 推荐(0) 编辑