2015 年 7月 1 日随笔档案 - masic

2015年7月1日

摘要：分布式计算，数据尽量在本地计算，减少网络I/O如果操作之间相互关系不大，则尽量采用分布式计算。spark采用分布式计算中的master-slave模型，master对应含有master进程的节点，slave对应含有worker进程的节点。Client 负责提交应用，driver负责控制应用的执行。基... 阅读全文

posted @ 2015-07-01 22:20 masic 阅读(581) 评论(0) 推荐(0)

Coder's Timeline