摘要: MapReduce的流程分为11个步骤,4个实体 1、客户端:编写MapReduce的代码,配置作业,提交作业 2、JobTracker:初始化作业,分配作业,与TaskTracker通信,协调整个作业的执行 3、TaskTracker:保持JobTracker的通信,在分配的数据段上执行Map和R 阅读全文
posted @ 2017-05-20 16:54 透明1190 阅读(1055) 评论(2) 推荐(0)
摘要: Core/Common 为其他子项目提供支持的工具,包括FileSystem、RPC、和串行化库、提供API Avro 用于数据序列化的系统,数据的读和写是在模式下完成,数据和模式都是自描述的,客户端和服务端通过握手协议进行模式的交换。客户端和服务端拥有相同的全部的模式,不同模式下的相同命名字段、丢 阅读全文
posted @ 2017-05-20 11:36 透明1190 阅读(137) 评论(0) 推荐(0)