2018年7月25日

摘要: 1RDD:弹性数据集,如果把RDD对应到单机程序中的变量,类似于一个数组,他是相同类型变量的一个线性集合,但是RDD是分布在不同worker上的,一个sparkJob中的变量,除了RDD都是存储在本地也就是master机器driver进程的空间内存里的,而RDD是存在很多worker机器的execu 阅读全文
posted @ 2018-07-25 08:11 钻研spark 阅读(128) 评论(0) 推荐(0)

导航