Hadoop - 文章分类 - 某年某月某某人

Hadoop集群的启动步骤？？？

摘要：关闭集群的命令 stop-all.sh 1.先启动zookeeper集群在zookeeper安装目录的bin目录下执行，sh zkServer.sh start 出现leader和follower时候说明启动成功如果是第一次启动Hadoop集群，需要先将hdfs注册到zookeeper集群中，不阅读全文

posted @ 2019-08-20 16:20 某年某月某某人阅读(1434) 评论(0) 推荐(0)

Hadoop数据本地化策略

摘要：参考 https://blog.csdn.net/shenshengsu1990/article/details/94625194 结合下图来讲解 ...... JobTracker接收到任务之后，会去访问NameNode获取要处理的文件信息 NameNode将文件块的一些信息返回给JobTrack 阅读全文

posted @ 2019-08-16 14:30 某年某月某某人阅读(463) 评论(0) 推荐(0)

MapTask和ReduceTask 运行的底层细节 shuffle-map阶段和 shuffle-reduce阶段？？？？

摘要：参考 https://blog.csdn.net/u014313009/article/details/38072269 首先开始的是 shuffle-map阶段的流程依据上图讲解 1、Partition操作 map的输出结果是多个键值对（key和value），将由reduce合并，而集群中有多个阅读全文

posted @ 2019-08-16 10:42 某年某月某某人阅读(250) 评论(0) 推荐(0)

ResourceManager中的Scheduler(调度器)和ApplicationManager(应用程序管理器) 还有YARN的执行任务流程？？？？

摘要：参考 https://blog.csdn.net/qq_25948717/article/details/80554809 根据下图讲解首先说两个概念：调度器和应用程序管理器 Hadoop2.x中使用的调度器是Scheduler，它的职能仅仅是根据各个应用程序的资源需求进行资源分配，如下图再下来阅读全文

posted @ 2019-08-15 18:13 某年某月某某人阅读(500) 评论(0) 推荐(0)

如何搭建hadoop集群？？？

摘要：此过程没有在服务器搭建的具体步骤，仅有思路 zookeeper集群管控 Hadoop2.0之后，达到了元数据（用于存储NameNode寻找DataNode的信息）的实时备份，所有有两台NameNode（standby、active）。不管你Hadoop集群有多少节点，NameNode只有两个两个N 阅读全文

posted @ 2019-08-15 16:12 某年某月某某人阅读(118) 评论(0) 推荐(0)

理解MapReduce中的切片+分区？？？？

摘要：如上图，如果我HDFS中，word目录下有这四个文件，那么它能分为几个切片呢？？？ **** MapTask的数量=切片数量切块也分为两种一种是物理切块，一种是逻辑切块前者是将文件真正的变成文件块后者是用对象来封装每个文件块的信息，比如文件夹的起始位置、和长度。这样的来分切块的作用，假如我一阅读全文

posted @ 2019-08-15 14:29 某年某月某某人阅读(288) 评论(0) 推荐(0)

MapReduce中的combine有什么作用？？？

摘要：作用就是，合并...... 看下图 combine把map方法产生的多个key和value。合并到一个新的key和value，在传入到reducer中合并的目的是为了减少网络传输阅读全文

posted @ 2019-08-14 10:54 某年某月某某人阅读(540) 评论(0) 推荐(0)

Hadoop中的分区Partitioner？？？

摘要：参考 https://www.cnblogs.com/edisonchou/p/4297828.html Hadoop中分区，如果不指定的话，他会使用自带的HashPartitioner 如果你业务中有需求，需要使用分区来查看文件的时候，就需要自己定义分区来使用例如上图，需要统计手机号码的信息，就阅读全文

posted @ 2019-08-13 16:46 某年某月某某人阅读(135) 评论(0) 推荐(0)

Hadoop中如果Mapper和Reducer的执行结果一致时候？？？？

摘要：参考 https://www.cnblogs.com/dtj007/p/5485629.html 因为我们大家知道，分别有两种设置一种设置Mapper 一种是Reducer 如果一样的话，我们只需要记得，只设置Reducer的返回执行结果即可如果不一样的话，都需要设置的给张图片..... 如果阅读全文

posted @ 2019-08-13 15:55 某年某月某某人阅读(66) 评论(0) 推荐(0)

配置recoursemanage备份节点的时候，访问虚拟机中的主机名不能映射ip地址？？？

摘要：第一步看linux主机中看看配置主机名文件对不对？如果对就配置本地电脑的 hosts映射文件.... 再试一下就可以了阅读全文

posted @ 2019-08-08 17:45 某年某月某某人阅读(115) 评论(0) 推荐(0)

配置hadoop集群时，忘记配置免密登陆？？？？

摘要：这个忘记要输好多次密码的。。第一步不用输入密码的！！！！！！！！！一定要三台机器都验证一样，分别使用 ssh 主机名验证包括自己的主机阅读全文

posted @ 2019-08-08 17:01 某年某月某某人阅读(160) 评论(0) 推荐(0)

某年某月某某人

忠于你热爱的一切

文章分类 - Hadoop

公告