摘要: 分布式计算,数据尽量在本地计算,减少网络I/O如果操作之间相互关系不大,则尽量采用分布式计算。spark采用分布式计算中的master-slave模型,master对应含有master进程的节点,slave对应含有worker进程的节点。Client 负责提交应用,driver负责控制应用的执行。基... 阅读全文
posted @ 2015-07-01 22:20 masic 阅读(578) 评论(0) 推荐(0)