摘要: MapReduce在Yarn上执行流程、Yarn核心组件功能、模拟ApplicationMaster发送Task、Map端的join MapReduce在Yarn上执行流程 Yarn核心组件功能 模拟ApplicationMaster发送Task 在MR中,MapTask、ReduceTask 都是 阅读全文
posted @ 2022-02-16 22:06 阿伟宝座 阅读(62) 评论(0) 推荐(0)
摘要: MapReduce原理深入理解3 WordCount程序流程图解、combiner(合并)程序示例、3、InputSplit切片详解 1、WordCount示例程序处理流程图解 2、combiner(合并)程序示例 combiner,发生在map阶段,又叫做预聚合; 相当于map端的Reduce,因 阅读全文
posted @ 2022-02-16 21:49 阿伟宝座 阅读(467) 评论(0) 推荐(0)
摘要: MapReduce原理深入理解2 Map、Shuffle、Reduce过程详解 1、MR执行过程-map阶段 map任务处理 1.1 框架使用InputFormat类的子类--FileInputFormat把输入文件(夹)划分为很多InputSplit, 默认,每个HDFS的block对应一个Inp 阅读全文
posted @ 2022-02-16 20:22 阿伟宝座 阅读(636) 评论(0) 推荐(0)
摘要: MapReduce的代码编写 学生数据和总分数据关联(join) 程序代码 import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FileSystem; import org.apache.hadoop.fs 阅读全文
posted @ 2022-02-16 19:12 阿伟宝座 阅读(116) 评论(0) 推荐(0)
摘要: MapReduce的代码编写 统计学生的总分示例 score.txt 1500100001,1000001,98 1500100001,1000002,5 1500100001,1000003,137 1500100001,1000004,29 1500100001,1000005,85 15001 阅读全文
posted @ 2022-02-16 15:07 阿伟宝座 阅读(365) 评论(0) 推荐(0)
摘要: MapReduce的代码编写 统计学生性别示例 student.txt 1500100001,施笑槐,22,女,文科六班 1500100002,吕金鹏,24,男,文科六班 1500100003,单乐蕊,22,女,理科六班 1500100004,葛德曜,24,男,理科三班 1500100005,宣谷芹 阅读全文
posted @ 2022-02-16 11:15 阿伟宝座 阅读(435) 评论(0) 推荐(0)