Hadoop集群regionserver节点故障
全触点Hadoop集群出现regionserver频繁掉的现象,大部分掉的都是140的regionserver节点,查看日志后发现两处信息



查看相关主机信息并无异常,日志信息显示由于与zk的session超时,查看MaxSessionTimeout、zookeeper.session.timeout这2个参数,发现参数设置过小


建议调整参数
MaxSessionTimeout 调整为210000
MaxSessionTimeout 调整为210000
zookeeper.session.timeout 调整180000
20190219凌晨两点至三点,137及140两台主机的regionserver节点均故障,相关的nmon监控及regionserver日志信息请查看附件
20190219凌晨两点至三点,137及140两台主机的regionserver节点均故障,相关的nmon监控及regionserver日志信息请查看附件