12 2020 档案
HIVE UDF
摘要:1、MAVEN依赖 <!-- https://mvnrepository.com/artifact/org.apache.hive/hive-exec --> <dependency> <groupId>org.apache.hive</groupId> <artifactId>hive-exec<
阅读全文
mapreduce任务中client生成split的源码过程
摘要:1、提交任务 //提交任务直到返回结果job.waitForCompletion(true); 2、点击waitForCompletion方法到Job.java类 3、跟进到submit方法,调用方法: return submitter.submitJobInternal(Job.this, clu
阅读全文
MapReduce任务运行过程
摘要:MR on YARN任务启动过程: 1、MR client 与NN通信,生成split信息,然后将split信息、jar包、运行配置信息上传到hdfs. 2、MR client向RM申请AppMaster。 3、RM分配到NM,NM启动AM。 4、AM向RM申请资源。 5、RM分配资源,对应的NM启
阅读全文
HDFS 读写流程
摘要:HDFS写流程: 1、Client和NN连接,创建文件元数据。 2、NN判定元数据是否有效,如是否已经存在等。 3、NN触发副本放置策略,返回一个有序的DN列表。 4、Client和DN、DN与DN之间(以及根据副本策略)建立pipeline连接 5、Client将数据块切分成64K的packet,
阅读全文
浙公网安备 33010602011771号