JVM-运行时数据区-堆

一个JVM实例只存在一个推内存，堆也是Java内存管理的核心区域。
Java堆区在JVM启动的时候就被创建，其空间大小也就确定。也是JVM管理的最大一块内存空间。
- 堆内存的大小是可以调节的。
Java虚拟机规范规定，堆可以处于物理上不连续的内存空间中，但在逻辑上它应该被视为连续的。
所有的线程共享Java堆。
在Java虚拟机规范中堆Java堆的描述是：所有的对象实例以及数组都应当在运行时分配在堆上。
数据和对象可能永远不会存储在栈上，因为栈帧中保存引用，这个引用指向对象或者数据在堆中的位置。
在方法结束后，堆中的对象不会马上被移除，仅仅在垃圾收集的时候才会被移除。
堆是GC执行垃圾回收的重点区域。

堆空间大小设置

Java堆区用于存储Java对象实例，那么堆的大小在JVM启动时就已经设定好了，大家可以通过选项"-Xmx"和"-Xms"设置
- "-Xms"用于设置堆区(年轻代+老年代)的起始内存大小，等价于-XX:InitialHeapSize
  - -X 是JVM运行参数
  - ms是memory start
- "-Xmx"用于表示堆区的最大内存，等价于-XX:MaxHeapSize
默认情况下堆大小
- 初始内存大小：物理内存大小/64
- 最大内存大小：物理内存大小/4
开发中建议将初始堆内和最大堆内存设置为相同值
查看设置的参数：
- 方法一：jps / jstat -gc 进程id
- 方法二：启动加上-XX:+PrintGCDetails

OutOfMemory举例

public class OomTest {

    public static void main(String[] args) {
        List<picture> list = new ArrayList<>();

        try {
            Thread.sleep(20);
        } catch (InterruptedException e) {
            e.printStackTrace();
        }

        while (true) {
            list.add(new Picture(new Random().nextInt(1024 * 1024)));
        }
    }
}

class Picture {
    private byte[] pixels;

    public Picture(int length) {
        pixels = new byte[length];
    }
}

内存细分

Java7之前堆内存逻辑上上分为三部分：新生区+养老区+永久区
- Young Generation Space 新生区
  - 又被划分为Eden和Survivor区
- Tenure Generation Space 养老区
- Permanent Space 永久区
Java8及之后堆内存逻辑上分为三部分：新生区+养老区+元空间
- Young Generation Space 新生区
  - 又被划分为Eden和Survivor区
- Tenure Generation Space 养老区
- Meta Space 元空间

新生代代与老年代

存储在JVM中的Java对象可以被划分为两类：
- 一类是生命周期较短的瞬时对象，这类对象的创建和消亡都非常迅速
- 另一类对象的生命周期却非常长，在某些极端的情况下还能够与JVM的生命周期保持一致。
Java堆区进一步细分成年轻代和老年代
其中新生代又可以划分为Eden空间、Survivor1空间（有时也叫from区、to区）
新生代和老年代配置
- -XX:NewRatio=2（设置新生代和老年代内存大小的比例，默认1：2）
新生代中Eden的空间和Survivor空间配置
- -XX:SurvivorRatio调整(默认是8:1:1但是Java存在自适应机制，需显示声明此参数才会生效)
新生代最大内存大小配置（一般不设置）
- -Xmn
几乎所有的Java对象都是在Eden区被new出来的
绝大部分的Java对象的销毁都在新生代进行

内存分配过程

总结

针对幸存者0和1区总结：复制之后有交换，谁空谁是to
关于垃圾回收：频繁在新生区收集，很少在养老区收集，几乎不在永久区/元空间收集
特殊过程

常用调优工具

JDK自带命令
- jinfo
- jstat
- javap
- jmap
Jconsole
JVisualVM
Jprofiler
Java Flight Recorder
GCViewer
GC Easy

Minor GC、Major GC与Full GC

JVM在进行GC时，并非每次都对三个内存（新生代、老年代；方法区）区域一起回收的，大部分时候回收的都是指新生代。

针对HotSpot VM的实现，它里面的GC按照回收区域又分为两大种类型：一种是部分收集（Partial GC），一种是整堆收集（Full GC）

部分收集：不是完整收集整个Java堆的垃圾收集。其中又分为：
- 新生代收集（Minor GC / Young GC）：只是新生代（Eden、s0、s1）的垃圾收集
- 老年代收集（Major GC / Old GC）：只是老年代垃圾收集
  - 目前，只有CMS GC会有单独收集老年代的行为
  - 注意，很多时候Major GC会和Full GC混淆使用，需要具体分辨老年代回收还是整堆回收
- 混合收集（Mixed GC）：收集整个新生代以及部分老年代的垃圾收集
  - 目前，只有G1 GC会有这种行为
整堆收集（Full GC）：收集整个Java堆和方法区的垃圾收集

简单介绍触发条件

年轻代GC（Minor GC）触发机制：
- 当年轻代空间不足时，就会触发Minor GC，这里指的是年轻代中的Eden代满了，Survivor满不会触发GC。（每次Minor GC会清理年轻代的内存）
- 因为Java对象大多朝生夕死的特性，所以Minor GC非常频繁，一般回收速度也比较快
- Minor GC会引发STW，暂停其他用户线程，等待垃圾回收结束，用户线程才恢复运行
老年代GC（Major GC/Full GC）触发机制：
- 指发生在老年代的GC，对象从老年代消失时，我们说“Major GC”或者“Full GC”发生了。
- 出现了Major GC，经常会伴随至少一次Minor GC（但非绝对的，在Parallel Scavenge收集器的收集策略里就有直接进行Major GC的策略选择过程）
  - 也就是在老年代空间不足时，会先尝试触发Minor GC。如果执行之后还是空间不足，则触发Major GC
- Major GC的速度一般比Minor GC慢10倍以上，STW的时间更长
- 如果Major GC后，内存还不足，就报OOM了
Full GC触发机制：
- 调用System.gc()时，系统建议执行Full GC，但是不必然执行
- 老年代空间不足
- 方法区空间不足
- 通过Minor GC后进入老年代的平均大小大于老年代的可用内存
- 由Eden区、survivor space0区向survivor space1区复制时，对象大小大于To Space可用内存，则把该对象转存到老年代，且老年代的可用内存小于该对象大小
说明：Full GC是开发或调优中尽量要避免的，这样暂停时间会短一些

堆空间分代思想

分代的唯一理由就是优化GC性能

内存分配策略

优先分配到Eden
大对象直接分配到老年代
- 尽量避免程序中出现过多的大对象
长期存活的对象分配到老年代
动态对象年龄判断
- 如果Survivor区中相同年龄的所有对象大小的总和大于Survivor空间的一半，年龄大于或等于该年龄的对象可以直接进入老年代，无须等到MaxTenuringThreshold中要求的年龄
空间分配担保
- -XX:HandlePromotionFailure

对象分配过程：TLAB

为什么有TLAB(Thread Local Allocation Buffer)

堆区是线程共享区域，任何线程都可以访问到堆区中共享数据
由于对象实例的创建在JVM中非常频繁，因此在并发环境下从堆区中划分内存空间是线程不安全的
为避免多个线程操作同一个地址，需要使用加锁等机制，会影响分配速度

什么是TLAB

从内存模型而不是垃圾收集的角度，堆Eden区域继续进行划分，JVM为每个线程在Eden区分配了一个私有缓存区域
多线程同时分配内存时，使用TLAB可以避免一系列的非线程安全问题，同时还能够提升内存分配的吞吐量，因此我们可以将这种内存分配方式称之为快速分配策略
尽管不是所有的对象实例都能够在TLAB中成功分配内存，但JVM确实将TLAB作为内存分配的首选
在程序中，开发人员可以通过-XX:UseTLAB设置是否开启TLAB空间（默认开启）
默认情况下，TLAB空间的内存非常小，仅占有整个Eden空间的1%。可以通过-XX:TLABWasteTargetPercent设置TLAB空间所占Eden空间的百分比
一旦对象在TLAB空间的分配内存失败时，JVM就会尝试着通过使用加锁机制确保数据操作的原子性，从而直接在Eden空间中分配内存

堆空间参数设置

https://docs.oracle.com/javase/8/docs/technotes/tools/unix/java.html

-XX:+PrintFlagsInitial 查看所有的参数的默认初始值
-XX:+PrintFlagsFinal 查看所有参数的最终值
- jinfo -flag SurvivorRatio pid
-Xms 初始堆空间内存（默认为物理内存的1/64）
-Xmx 最大堆空间内存（默认为物理内存的1/4）
-Xmn 设置新生代的大小（初始值及最大值）
-XX:NewRatio 配置新生代与老年代在堆结构的占比（默认1:2）
-XX:SurvivorRatio 设置新生代中Eden和S0/S1空间的比例
-XX:MaxTenuringThreshold 设置新生代垃圾的最大年龄
-XX:PrintGCDetails 输出GC详细日志
-XX:+PrintGC -verbose:gc 打印GC简要信息
-XX:HandlePromotionFailure 是否设置空间分配担保

关于HandlePromotionFailure

在发生Minor GC之前，虚拟机会检查老年代最大可用的连续空间是否大于新生代所有对象的总空间。

如果大于，则此次Minor GC是安全的
如果小于，则虚拟机会查看-XX:HandlePromotionFailure设置是否允许担保失败。
- 如果HandlePromotionFailure=true，那么会继续检查老年代最大可用连续可用空间是否大于历次晋升到老年代的对象的平均大小。
  - 如果大于，则尝试进行一次Minor GC，但这次Minor GC依然是有风险的。
  - 如果小于，则改为进行一次Full GC。
- 如果HandlePromotionFailure=false，则改为进行一次Full GC。

在JDK7后HandlePromotionFailure参数不在起作用规则变为只要老年代的连续空间大于新生代对象总大小或者历次晋级的平均大小就会进行Minor GC，否则将进行Full GC。

逃逸分析

如何将堆上的对象分配到栈，需要使用逃逸分析手段。
这是一种可以有效减少Java程序中同步负载和内存堆分配压力的跨函数全局数据流分析算法。
通过逃逸分析，Java编译器能够分析出一个新的对象的引用的使用范围从而决定是否要将这个对象分配到堆上。
逃逸分析的基本行为就是分析对象动态作用域
- 当一个对象在方法中被定义后，对象只在方法内部使用，则认为没有发生逃逸，会进行栈上分配。
- 当一个对象在方法中被定义后，它被外部方法所引用，则认为发生逃逸。例如作为调用参数传递到其他地方中。
从new的对象实体是否被外部方法调用来分析是否发生逃逸分析
JDK7之前-XX:+DoEscapeAnalysis显示开启逃逸分析
-XX:+PrintEscapeAnalysis查看逃逸分析的筛选结果
变量声明为static也会发生逃逸

结论

开发中能使用局部变量的，就不要在方法外定义。

代码优化

栈上分配。将堆分配转换为栈分配。如果一个对象在子程序中被分配，要使指向该对象的指针永远不会逃逸，对象可能是栈分配的候选，而不是堆分配。
同步省略。如果一个对象被发现只能从一个线程被访问到，那么对于这个对象的操作可以考虑不同步。
分离对象或标量替换。有的对象可能不需要作为一个连续的内存结构存在也可以被访问到，那么对象的部分可以不存储在内存，而是存储在CPU寄存器中。

标量替换

标量（Scalar）是指一个无法再分解成更小的数据的数据。Java中的原始数据类型就是标量。
相对的，那么还能分解的数据叫做聚合量（Aggregate），Java中的对象就是聚合量，因为他可以分解成其他聚合量和标量。

在JIT阶段，如果经过逃逸分析，发现一个对象不会被外界访问的话，那么经过JIT优化，就会把这个对象拆解成若干个其他包含若干成员变量来代替，这个过程叫标量替换。

posted @ 2021-03-17 20:34 Vic呼叫89 阅读(141) 评论(0) 收藏举报

刷新页面返回顶部

Loading

hey Vic !