文章分类 - 从入门到精通——hadoop
先分析原理,再实践
摘要:1.maptask收集的《k,v》放到缓存缓冲区中; 2.从内存缓冲区不断溢出到磁盘,溢出多个; 3.多个文件被合并成一个大文件; 4.在溢出和合并时,都要进行partition和排序; 5.reducetask根据自己的分区号从maptask的结果中拉取分区数据; 6.reducetask将取到的
阅读全文
摘要:1.角色:resourceManage;nodemanage 2.作用:resourceManage:提供job资源的存放路径;提供运算容器所需的资源信息; nodemanage:运算所在的地方。 3.举例结合mapreduce程序: client--》resourcemanage申请job; re
阅读全文
摘要:1.角色:MRAppMaster、maptask、reducetask 2.作用:MRAppMaster:根据task的状态,调度task; maptask:处理maptask的流程; reducetask:处理reducetask的流程; 3.举例wordcount:先启动MRAppMaster,
阅读全文
摘要:1.角色:namenode、datanode、secondarynamenode、hadoop-client 2.作用:namenode:管理元数据;接受hadoop-client的操作命令; datanode:存储文件block;定期向namenode发送block信息; secondarynam
阅读全文

浙公网安备 33010602011771号