jvm线上调优实战

　　在前面文章我们了解到了jvm的内存模型、对象分配的规则、以及对象何时进入到老年代、垃圾回收器，并且知道jvm调优的本质就是对堆内存进行调优，尽量使对象留在新生代中、少触发老年代gc。那么本文将介绍生产环境上如何去排查问题这样的一个思路。用的是最原始、有low、也最有效的jstat命令，因为每个公司情况不一样你不一定有权限使用jConsole、VisualVM那些可视化工具。

如何监控进程jvm信息

　　我们通过 jstat -gc PID 命令就可以来监控java进程的内存和GC情况了。

S0C：第一个幸存区的总大小(单位kb,1mb=1024kb，可以看到整个新生代一共刚好是设置的100mb)
S1C：第二个幸存区的总大小
S0U：第一个幸存区当前已使用大小
S1U：第二个幸存区当前已使用大小
EC：伊甸园区的总大小
EU：伊甸园区的使用大小
OC：老年代总大小
OU：老年代当前已使用大小
MC：方法区(元空间)总大小
MU：方法区(元空间)当前已使用大小
CCSC:压缩类空间大小
CCSU:压缩类空间使用大小
YGC：系统迄今为止年轻代垃圾回收次数
YGCT：年轻代垃圾回收总消耗时间和
FGC：系统迄今为止老年代垃圾回收次数
FGCT：老年代垃圾回收总消耗时间和
GCT：所有gc消耗总时间 (YGCT+FGCT)

除了 jstat -gc PID 之外，还有一些其他命令可以看到详细信息了，不过单独这一个命令就已经够用了。
jstat -gccapacity 堆内存分析
jstat -gcnew 年轻代GC分析，TT和MTT表示年轻代对象最小年龄和最大年龄
jstat -gcnewcapacity 年轻代内存分析
jstat -gcold 老年代GC分析
jstat -gcoldcapacity 老年代内存分析
jstat -gcmetacapacity 元空间内存分析

新生代对象增长速率

　　jstat -gc PID time num ，这个命令就是每隔指定time时间监控一次jvm信息，一共统计num次。比如我们现在每隔1s统计一次，一共统计5次。

　　我们现在只需要看“EU”这一列，就可以看到eden区的使用情况了。如果第一次是200mb，第二次205mb，第三次209mb。那么我们可以估算出每秒eden区新增5mb对象。我们可以根据自己系统的情况设置成每分钟或者每十分钟监控一次，也可以看看系统高峰期和日常两种情况下对象的增长速率。

Young GC触发频率和耗时

　　我们知道eden区新增对象的速率后，就可以计算出young gc触发的频率和耗时了。比如eden区有800mb对象，每秒新增5m，那么160s就会把eden区装满、差不多3分钟的样子就会触发一次young gc。如果每秒新增0.5m对象，那就是30分钟一次young gc。gc耗时我们可以用 ygct/ygc 求出每次young gc的所用时长。

老年代对象增长速率

3分钟一次young gc，那我们就3分钟监控一次jvm信息，查看10次。jstat -gc PID 180000 10

　　此时可以看看young gc后 eden survivor 老年代的对象变化。正常来讲，eden区每次放满对象再gc后，里面的对象会变得很少。然后survivor区会放入一些存活对象，老年代也会增长一些对象。

　　正常来讲，一般老年代对象不会增长的很快，因为我们的系统其实没那么多长期存活的对象。如果每次young gc后，老年代增长几十mb，说明young gc后存活的对象太多了需要调优下，一般新增几百kb、几mb才是正常水准。我们通过这十次每次进入老年的的对象大小求出平均数，就知道老年代的增长速率啦。

Full GC触发频率和耗时

　　比如现在我们知道每3分钟一次young gc后有50mb进入老年代，那么48分钟就会把老年代装满触发一次full gc。比如现在一共进行了10次full gc共耗时20s，那么每次耗时就是2s。

jvm调优实战

案例代码

/**

java  -jar -Xmn100M -Xms200M -Xmx200M -XX:SurvivorRatio=8 -XX:MaxTenuringThreshold=15 -XX:PretenureSizeThreshold=20M -XX:+UseParNewGC -XX:+UseConcMarkSweepGC -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -Xloggc:gc.log  demo-1.0.jar

 新生代100m ， 总堆200m ， eden:from:to=8:1:1 ， 超过15岁进入老年代 ， 大对象阈值20m ， parnew+cms回收
 */
public class Demo1 {

    public static void main(String[] args) throws Exception{
        // 系统先休眠30s，给我们足够的时间找到pid来监测进程情况。
        Thread.sleep(30000);
        while (true){
            loadData();
        }
    }

    private static void loadData()throws Exception{
        byte[] data = null;
        // 每次生成40mb垃圾对象
        for(int i=0;i<4;i++){
            data = new byte[10 * 1024 * 1024];
        }
        data = null;
        // data1 data2 被引用不会成为垃圾
        byte[] data1 = new byte[10 * 1024 *1024];
        byte[] data2 = new byte[10 * 1024 *1024];
        byte[] data3 = new byte[10 * 1024 *1024];
        // data3指向新对象，之前的成为垃圾
        data3 = new byte[10 * 1024 *1024];

        // 阻塞1s，来模拟每个请求执行完需要1s
        Thread.sleep(1000);
    }
}

gc分析

1. 最开始eden区一直只有1638kb，说明线程还在30s的阻塞中没开始创建对象
2. 下一秒可以看到已经触发了young gc了。eden区只有80m，我们创建了80m对象再加上一些系统自己占用的内存，所以eden就放不下了。回收了282k在survivor区中(一些系统未知对象)，data1 data2 data3 一共30mb放入了老年代。
3. 每次young gc都会存活很多对象，而survivor放不下，都会直接进入老年代
4. 老年代从30m、50m、60m又变成了30m，说明老年代放不下了对60m进行了fgc回收，装了新的30m

　　通过对比可以看到每秒执行一次ygc，每2秒左右执行一次fgc。每次ygc差不多22/0.146=0.0067秒，每次fgc差不多0.013/10=0.0013秒。ygc执行时间是fgc5倍。所以不难发现，我们的ygc不是由于老年代自己空间不足发生的，而是新生代ygc的时候survivor放不下，触发了老年代的空间担保机制和动态年龄判断造成的。ygc每次都要等fgc将老年代清出空余位置后才把对象放入老年代。所以才会出现ygc比fgc时间要长的情况。

性能调优

　　鉴于上一步的分析，我们可以看出由于新生代的内存不足，导致每次ygc都会将对象放入老年代，频繁触发fgc。所以我们要加大新生代内存空间，最好survivor区可以放下每次ygc的对象。

java  -jar -Xmn200M -Xms300M -Xmx300M -XX:SurvivorRatio=2 -XX:MaxTenuringThreshold=15 -XX:PretenureSizeThreshold=20M -XX:+UseParNewGC -XX:+UseConcMarkSweepGC -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -Xloggc:gc.log  demo-1.0.jar


新生代200m，总堆300m，eden:s0:s1=2:1:1    此时查看jvm可以看到没有触发fgc了，只有少量对象进入老年代中。一般的系统young gc几分钟或几十分钟一次，每次不超过几十毫秒是正常的；full gc几十分钟或几小时一次，几百毫秒之内是正常的。

posted @ 2021-02-07 23:35 吴磊的阅读(1295) 评论(0) 收藏举报

刷新页面返回顶部

码农的自我修养

不只做一个技术者，更要做一个思考者。 ——吴磊 (qq：2466845324)