namenode 问题小记

Namenode挂掉，Namenode gc日志里面YGC报错promotion failed

NameNode进程挂掉，Namenode gc日志里面YGC报错promotion failed。

Young gc的时候，需要复制eden区和from区内的对象到to区，如果此时to区满了，就会使用悲观策略复制到old区，而此时old区也满了，就会报promotion failed。

1.扩大NN内存。

生产集群namenode Full GC 告警频繁

将standby namenode（nn1）的内存扩至80GB后，切换namenode，standby namenode在转换为active状态时进程死掉，查看namenode和zkfc日志发现：

standby namenode由standby转换为active时，出现socket timeout，导致namenode状态转为SERVICE_NOT_RESPONDING，切换失败。

bdp生产集群文件数量达到1.9亿，namenode当前内存64G，已使用约57G，内存不足，GC严重

主机内存共128G，当前namenode内存为64GB，除namenode，resourcemanager，ZK，journalnode，ZKFC等进程已分配的内存外，剩余总内存约40G。

posted @ 2018-09-30 20:10 George_sz Views(1337) Comments(0) 收藏举报

刷新页面返回顶部

学而不思则罔，思而不学则殆