摘要:
RDD,全称为Resilient Distributed Datasets,是一个容错的、并行的数据结构,可以让用户显式地将数据存储到磁盘和内存中,并能控制数据的分区。同时,RDD还提供了一组丰富的操作来操作这些数据。在这些操作中,诸如map、flatMap、filter等转换操作实现了monad模 阅读全文
posted @ 2017-11-06 14:32 打杂滴 阅读(452) 评论(0) 推荐(0)
posted @ 2017-11-06 14:32 打杂滴 阅读(452) 评论(0) 推荐(0)
posted @ 2017-11-06 11:57 打杂滴 阅读(1391) 评论(0) 推荐(0)