hadoop02-入门面试题
Hadoop运行模式:
本地模式:单机运行,数据存储在local本地,用于测试
伪分布式模式:单机运行,数据存储在HDFS,一台服务器模拟分布式环境,用于测试
下面是常见的hadoop基础面试题:
Hadoop常用的端口号:
3.x :
HDFS NameNode 内部通讯端口 8020 / 9000 / 9820
HDFS NameNode 对用户的查询端口 9870
Yarn 查看任务运行情况的端口 8088
历史服务器端口 19888
2.x:
HDFS NameNode 内部通讯端口 8020 / 9000
HDFS NameNode 对用户的查询端口 your 50070
Yarn 查看任务运行情况的端口 8088
历史服务器端口 19888
Hadoop常用的配置文件:
3.x :
Core-site.xml / hfs-site.xml / yarn.site.xml / mapped-site.xml / workers
2.x :
Core-site.xml / hfs-site.xml / yarn.site.xml / mapped-site.xml / slaves
DataNode 和 NameNode 进行同时只能有一个工作的问题:
问题描述:
原因:
NameNode在format初始化后会生成cluesterID(集群id)
DataNod在启动后也会生成和NameNode相同的clusterId(集群id)
假如NameNode宕机后重新格式化启动,会重新生成一个新的cluesterID(集群id),此时,DataNod和NameNode的cluesterID是不一致的,无法建立连接,只能有一个在线,所以就会出现上述情况
解决方式:
把集群所有的进行都停止掉
把集群DataNode对应的data和log目录都删除

浙公网安备 33010602011771号