JVM垃圾回收分析

GC和GC Tuning

GCC基础知识

什么是垃圾

C语言申请内存：malloc free

C++: new delete

C/C++: 手动回收内存

Java:

自动内存回收，编程简单，系统不易出错，容易出现两种类型问题：

忘记回收

多次回收

如何定位垃圾

引用计数(RefrenceCount), 无法解决对象循环引用问题

根可达算法(RootSearching)

常见的垃圾回收算法

标记清除(mark sweep)---位置不连续，容易产生内存碎片，碎片多的情况下导致空间利用率不高

copy算法---没有碎片，但是浪费空间

标记压缩算法(mark compact)---没有碎片，效率低(两边扫描，指针需要调整)

JVM内存分代模型

部分垃圾回收器使用的模型

除Epsilon ZGC Shenandoah之外的GC都使用逻辑分代模型

G1是逻辑分代，物理不分代

除此之外不仅逻辑分代，而且物理分代

新生代+老年代+永久代(1.7)Perm Generation/元数据区(1.8) Metaspace
1. 永久代元数据---Class
2. 永久代必须指定大小限制，元数据可以设置，也可以不设置，无上限(受限于物理内存)
3. 字符串常量1.7--永久代 1.8--堆
4. MethodArea逻辑概念--永久代、元数据
新生代=Eden+2个survivor区
1. YGC回收后，大多数对象会被回收，或者进入S0
2. 再次YGC，活着对象Eden+S0->S1
3. 再次YGC, Eden+S1->S0
4. 年龄足够-->老年代(PS 15 CMS 6)
5. s区装不下-->老年代
老年代
1. 顽固分子
2. 老年代满了则FGC /Full GC
GC Tunning(Generation)
1. 尽量减少FGC
2. MinorGC=YGC
3. MajorGC=FGC
对象分配过程
动态年龄(不重要)

https://www.jianshu.com/p/989d3b06a49d
分配担保(不重要)

YGC期间survivor区空间不够了，空间担保直接进入老年代

常见的垃圾回收器

垃圾回收器的发展路线是随着内存越来越大的过程而演进

从分代算法演化到不分代算法

Serial算法几十M

Parallel算法几个G

CMS 几十个G---承上启下，开始并发回收

G1-上百个G

ZGC-- 4T-16T (JDK13)

三色标记
JDK1.0只有Serial，后来为了提高效率诞生并发垃圾回收器，发展史
Serial采用copy方式回收年轻代
Serial-Old采用标记压缩回收老年代
Parallel Scavenge 使用多线程采用copy方式回收垃圾
Parallel old采用多线程压缩算法进行回收
ParNew与PS一样，只是为了配合CMS使用
CMS
1. concurrent mark sweep
2. a mostly concurrent, low-pause collector
3. initial mark(find GC ROOT), concurrent mark(可能会标错), remark(剔除标记错误的对象，不应该被标记), concurrent sweep
4. 算法: 采用三色标记法+Incremental Update
缺点：

内存碎片，加入-XX:CMSFullGCsBeforeCompaction

浮动垃圾

Concurrent Model Failure -XX: CMSInitiatingOccupancyFraction 92%

当内存碎片具多时，CMS将采用Serial old方式回收垃圾
G1(200ms-10ms)

算法: 采用三色标记法+SATB
ZGC(100ms-1ms) PK C++

算法: ColoredPointers + LoadBarrier

Shenandoah

算法: ColoredPointers + WriteBarrier

三色标记法

白色：未被标记

灰色：自身被标记但成员未被标记

黑色：自身和成员都被标记

产生漏标：

标记进行时增加一个黑到白的引用，如果不重新对黑色进行处理，则会漏标
标记进行时删除了灰色对象到白对象的引用，那么这个白对象有可能被漏标

常见的垃圾回收器组合参数设定

-XX:+UseSerialGC ===Serial New + Serial Old
-XX:+UseParNewGC ===ParNew + Serial Old
-XX:+UseConcurrentMarkSweepGC ===ParNew + CMS + Serial Old
-XX:+UseParallelOldGC ===PS + PO
-XX:+UseParallelGC ===PS + PO
-XX:+UseG1GC ===G1

CMS三色标记

JVM调优

JVM命令行参数：https://blog.csdn.net/zhyhang/article/details/105037987

试用程序

public class HelloGC {
    public static void main(String[] args) {
        System.out.println("Hello GC!");
        LinkedList<Object> objects = new LinkedList<>();
        while (true) {
            byte[] b = new byte[1024*1024];
            objects.add(b);
        }
    }
}

区分概念内存泄漏 memory leak，内存溢出out of memory
java -Xmn10M -Xms40M -Xmx60M --XX:+PrintGC HelloGC
java -XX:+PrintFlagsInitial 显示默认参数
java -XX:+PrintFlagsFinal 显示最终参数

调优的基础概念

吞吐量：用户代码执行时间/(用户代码执行时间+垃圾回收时间)

响应时间：STW越短，响应时间越好

调优需要明确是吞吐量优先，还是响应时间优先，或者满足一定响应时间下，吞吐量越大越好。

科学计算、数据挖掘一般要求吞吐量优先，可以选择PS+PO

Web网站，RestAPI一般要求响应优先

什么是调优

根据需要进行JVM规划和预调优

优化JVM运行环境(慢、卡顿等)

解决JVM运行过程中出现的各种问题

调优步骤

调优从业务场景开始，没有业务场景的调优就是耍流氓
无监控，不调优，系统只有通过压力测试，看到结果，才能明确调优方向
根据实际业务选择垃圾回收
计算内存需求
选定CPU，主频越高越好
设置年代大小，年龄升级的阈值
设置日志参数 -Xloggc:/path/to/xxx-%t.log -XX:+UseGCLogFileRotation -XX:NumberOfGCLogFiles=5

-XX:GCLogFileSize=20M -XX:+PrintGCDetails -XX:+PrintGCDateStamps -XX:+PrintGCCause
观察日志

优化环境

有一个50w PV的资料网站(从磁盘读取文档到内存)原服务器32位、1.5G的堆内存，用户反馈网站反应慢，因此公司将服务升级为64位、16G堆内存，结果用户反映有时反应比以前更慢了？

网站慢是因为很多用户浏览网站，需要将数据从文件load到内存，而内存过小导致频繁GC，STW时间过长，导致应用反应慢；换大内存反应还慢是因为内存大了后FGC的时间过长，因此需要调整垃圾回收器

系统CPU经常100%，如何优化？

首先找出那个进程CPU使用率高(top)
找出该进程那个线程CPU使用率高(top -Hp)
导出该线程堆栈(jstack)
查看那个方法消耗时间(jstack)
工作线程占比高还是垃圾回收器占比高

系统内存飙高，如何查找原因？

导出堆内存(jmap)
分析(jhat、jvisualvm、mat)

解决JVM运行中的问题

通过一个案例理解工具

public class HelloGC {
    private static ScheduledThreadPoolExecutor executor = new ScheduledThreadPoolExecutor(50,
            new ThreadPoolExecutor.DiscardOldestPolicy());

    public static void main(String[] args) {
        executor.setMaximumPoolSize(50);
        while (true) {
            modelFit();
            try {
                TimeUnit.MILLISECONDS.sleep(100);
            } catch (InterruptedException e) {
                e.printStackTrace();
            }
        }
    }

    private static class CardInfo {
        BigDecimal price = new BigDecimal(0.0);
        String name = "Liming";
        int age = 25;
        Date birthday = new Date();

        public void m() {
            //do something
        }
    }

    private static void modelFit() {
        List<CardInfo> tasks = getAllCardInfo();
        tasks.forEach(e->executor.scheduleWithFixedDelay(e::m, 2 ,3, TimeUnit.SECONDS));
    }

    private static List<CardInfo> getAllCardInfo() {
        List<CardInfo> list = new ArrayList<>();
        for (int i = 0; i < 100; i++) {
            CardInfo cardInfo = new CardInfo();
            list.add(cardInfo);
        }
        return list;
    }
}

java -Xms200M -Xmx200M -XX:PrintGC HelloGC

问题排查流程与命令

JPS 查看java进程
jstack定位线程状况、重点关注：WAITING BLOCKED（容易出现死锁）
jinfo pid
jstat -gc 4655 500 每隔500毫秒打印GC的情况
jmap -histo 4655 | head -20 查看堆中的对象，如果堆内存特别大时，该命令会对进程产生影响，甚至卡顿(生成环境不适合用)，压测的时候可以使用
虚拟机启动时设定参数HeapDump, OOM的时候自动产生堆转储文件(不专业，因为有监控的话内存增长会报警)
很多服务器备份（高可用），停掉这台服务器对其他服务器不影响
jmap -dump:format=b, file=dump.bin pid
使用MAT/jhat/jvisualvm进行dump文件分析

GC常用参数

https://www.cnblogs.com/farmersun/p/12439969.html

参考资料

https://blogs.oracle.com/jonthecollector/our-collectors

posted @ 2020-07-21 22:34 被罚站的树阅读(471) 评论(0) 收藏举报

刷新页面返回顶部

被罚站的树