摘要:
1RDD:弹性数据集,如果把RDD对应到单机程序中的变量,类似于一个数组,他是相同类型变量的一个线性集合,但是RDD是分布在不同worker上的,一个sparkJob中的变量,除了RDD都是存储在本地也就是master机器driver进程的空间内存里的,而RDD是存在很多worker机器的execu 阅读全文
posted @ 2018-07-25 08:11
钻研spark
阅读(128)
评论(0)
推荐(0)

浙公网安备 33010602011771号