hadoop02-入门面试题

Hadoop运行模式:

  1. 本地模式:单机运行,数据存储在local本地,用于测试

  2. 伪分布式模式:单机运行,数据存储在HDFS,一台服务器模拟分布式环境,用于测试

  3. 完全分布式模式:多台服务器组成,生产环境使用

 

下面是常见的hadoop基础面试题:

Hadoop常用的端口号:

3.x :

HDFS NameNode 内部通讯端口 8020 / 9000 / 9820

HDFS NameNode 对用户的查询端口 9870

Yarn 查看任务运行情况的端口 8088

历史服务器端口 19888

2.x:

HDFS NameNode 内部通讯端口 8020 / 9000

HDFS NameNode 对用户的查询端口 your 50070

Yarn 查看任务运行情况的端口 8088

历史服务器端口 19888

Hadoop常用的配置文件:

3.x :

Core-site.xml / hfs-site.xml / yarn.site.xml / mapped-site.xml / workers

2.x :

Core-site.xml / hfs-site.xml / yarn.site.xml / mapped-site.xml / slaves

DataNode 和 NameNode 进行同时只能有一个工作的问题:

问题描述:启动DataNode,NameNode下线,启动NameNode,DataNode下线。

原因:

  1. NameNode在format初始化后会生成cluesterID(集群id)

  2. DataNod在启动后也会生成和NameNode相同的clusterId(集群id)

  3. 假如NameNode宕机后重新格式化启动,会重新生成一个新的cluesterID(集群id),此时,DataNod和NameNode的cluesterID是不一致的,无法建立连接,只能有一个在线,所以就会出现上述情况

解决方式:

  1. 把集群所有的进行都停止掉

  2. 把集群DataNode对应的data和log目录都删除

  3. 格式化后重新启动即可

posted @ 2022-03-09 23:27  迷路小孩  阅读(36)  评论(0)    收藏  举报