cdh种hdfs启动ha后,删除namenode恢复
1.从以下界面把删掉的NameNode,JournalNode和Failover Controller的三个角色再给加回去。

2.点击添加角色实例,并相应的选择之前删掉NameNode,JournalNode和Failover Controller角色所在的主机ip-172-31-9-113.ap-southeast-1.compute.internal

3.点击“继续”


5.直接重启HDFS服务,尝试拉起刚刚新加的三个角色

还是失败。
6.进入ip-172-31-9-113.ap-southeast-1.compute.internal节点所在的NameNode配置页面。

选择“配置”标签页

在“NameNode Nameservice”配置项中输入nameservice1,这里根据你集群启用HA后的实际情况nameservice的名字输入,然后保存。

7.在“Quorum Journal 名称”配置项也输入nameservice1,这里根据你集群启用HA后的实际情况nameservice的名字输入,然后保存。


8.勾选“启用自动故障转移”,然后保存。

9.回到HDFS服务的实例页面,发现之前的错误已经消失了。

10.回到CM主页重新部署客户端,并重启集群所有服务。

重启成功,集群恢复正常。

原文链接:
https://mp.weixin.qq.com/s?__biz=MzI4OTY3MTUyNg==&mid=2247495873&idx=1&sn=2aa2057c70e954baa3cecd4ab2a8c170&chksm=ec2920c8db5ea9deb61c51a76d2d170df51ff7ff78f4ec9223123ee829791ff199a989b7d9ac&scene=21#wechat_redirect
浙公网安备 33010602011771号