JVM

一、JVM

1.JVM

(1)JVM(Java Virtual Machine)是一个运行在计算机上的程序,他的职责是运行Java字节码文件。

(2)JVM的三大核心功能:

  • 内存管理
  • 解释执行虚拟机指令
  • 即时编译

(3)常见的JVM:

image-20240114164342180

2.JVM的组成

image-20240114174322521

二、字节码文件

1.字节码文件的组成

(1)基础信息

  • Magic魔数
  • 主副版本号
  • 访问表识
  • 类、父类、接口索引

(2)常量池

(3)字段

(4)方法

(5)属性

2.Magic魔数

(1)文件是无法通过文件扩展名来确定文件类型的,文件扩展名可以修改,不影响文件的内容。

(2)软件使用文件的头几个字节(文件头)去校验文件的类型,如果文件不支持这种类型就会出错:

image-20240115122147309

(3)Java字节码文件中,将文件头成为magic魔数。

3.主副版本号

(1)主副版本号指的是编译字节码文件的JDK版本号,主版本号用来标识大版本号,JDK1.0-1.1使用了45.0-45.3,JDK1.2是46之后每升级一个大版本就加1;副版本号是当主版本号相同时作为区分不同版本的标识,一般只需要关心主版本号。

(2)版本号的作用主要是判断当前字节码的版本和运行时的JDK是否兼容。

4.常量池

(1)字节码文件中常量池的作用:避免相同的内容重复定义,节省空间。

(2)常量池中的数据都有一个编号,编号从1开始。在字段或者字节码指令中通过编号可以快速的找到对应的数据。

(3)字节码指令中通过编号引用到常量池的过程称之为符号引用。

5.方法

(1)字节码中的方法区域是存放字节码指令的核心位置,字节码指令的内容存放在方法的C偶的属性中。

(2)操作数栈是临时存放数据的地方,局部变量表是存放方法中的局部变量的位置。

三、类的生命周期

1.加载阶段

(1)加载阶段第一步是类加载器根据类的全限定名通过不同的渠道以二进制流的方式获取字节码信息。

(2)类加载器在加载完类后,Java虚拟机会将字节码中的信息保存到内存的方法区中。

​ 生成一个InstanceKlass对象,保存类的所有信息,里面还包含实现特定功能比如多态的信息。

(3)同时,Java虚拟机还会在堆中生成一份与方法区中数据相似的java.lang.Class对象。

​ 作用是在Java代码中去获取类的信息以及存储静态字段的数据。(JDK8之后)。

2.连接阶段

(1)验证:验证内容是否满足《Java虚拟机规范》

  • 文件格式验证、主次版本号是否满足当前Java虚拟机版本要求。
  • 元信息验证,例如必须有父类(super不为空)。
  • 验证程序执行指令的语义,比如方法内的指令执行到一般强行跳转到其他方法中。
  • 符号引用验证,例如是否访问了其他类中private的方法等。

(2)准备:为静态变量分配内存并设置初始值

  • final修饰的基本数据类型的静态变量,准备阶段直接会将代码中的值进行赋值。

(3)解析:将常量池中的符号引用替换成指向内存的直接引用

3.初始化阶段

(1)初始化阶段会执行静态代码块中的代码,并为静态变量赋值。

(2)初始化阶段会执行字节码文件中的clint部分的字节码指令。

(3)以下几种方式会导致类的初始化:

  • 访问一个类的静态变量或者静态方法,注意变量是final修饰的并且等号右边是常量不会触发初始化。
  • 调用Class.forName(String className)
  • new一个该类的对象时
  • 执行Main方法的当前类

(4)直接访问父类的静态变量,不会触发子类的初始化。

(5)子类的初始化clinit调用之前,会先调用父类的clinit初始化方法。

4.使用

5.卸载

四、类加载器

1.类加载器

类加载器(ClassLoader)是Java虚拟机提供给应用程序去实现获取类和接口字节码数据的技术,类加载器只参与加载过程中的字节码获取并加载到内存这一部分。

2.类加载器的分类

(1)Java代码中实现的:

  • 扩展类加载器Extension
  • 应用程序类加载器Application

(2)Java虚拟机底层源码实现的(C++):

  • 启动类加载器Bootstrap

3.启动类加载器

(1)启动类加载器是由Hotspot虚拟机提供的、使用C++编写的类加载器。

(2)默认加载Java安装目录/jre/lib下的类文件。

(3)通过启动类加载器去加载用户jar包。

  • 放入jre/lib下进行扩展

    不推荐,会出现即使放进去由于文件名不匹配的问题也不会正常的被加载。

  • 使用参数进行扩展

    推荐,使用-Xbootclasspath/a:jar包名 进行扩展。

4.扩展和应用程序类加载器

(1)扩展类加载器和应用程序类加载器都是JDK中提供的、使用Java编写的类加载器。

(2)它们的源码都位于sun.misc.Launcher中,是一个静态内部类。继承自URLClassLoader。具备通过目录或者指定jar包将字节码文件加载到内存中。

(3)扩展类加载器:

  • 默认加载Java安装目录/jre/lib/ext下的类文件。

  • 通过扩展类加载器去加载用户jar包:

    • 放入/jre/lib/ext下进行扩展

      不推荐,尽可能不要去更改jdk安装目录中的内容。

    • 使用参数进行扩展

      推荐,使用-Djava.ext.dirs=jar包目录 进行扩展,这种方式会覆盖原始目录,可以用;(windows):(macos/linux)追加上原始目录。

5.类的双亲委派机制

(1)双亲委派机制:当一个类加载器接收到加载类的任务时,会自底向上查找是否加载过,再由顶向下进行加载。

image-20240117103721305

(2)双亲委派机制的作用

  • 保证类加载的安全性
  • 避免重复加载

(3)打破双亲委派机制的三种方式

  • 自定义类加载器
  • 线程上下文类加载器
  • Osgi框架的类加载器

(4)自定义类加载器

  • 自定义类加载器并且重写loadClass方法,就可以将双亲委派机制的代码去除。
  • Tomcat通过这种方式实现应用之前类隔离。

(5)线程上下文类加载器

  • 利用上下文类加载器加载类,比如JDBC和JNDI等。

(6)Osgi框架的类加载器

  • 历史上Osgi框架实现了一套新的类加载器机制,允许同级之间委托进行类的加载。

6.JDK8之后的类加载器

(1)JDK8及之前的版本中,扩展类加载器和应用程序类加载器的源码位于rt.jar包中的sun.misc.Launcher.java。

(2)由于JDK9引入了module的概念,类加载器在设计上发生了很多变化:

  • 启动类加载器使用Java编写,位于jdk.internal.loader.ClassLoaders类中。

    Java中的BootClassLoader继承自BuiltinClassLoader实现从模块中找到要加载的字节码资源文件。

    启动类加载器依然无法通过java代码获取到,返回的仍然是null,保持了统一。

  • 扩展类加载器被替换成了平台类加载器(Platform Class Loader)。

    平台类加载器遵循模块化方式加载字节码文件,所以继承关系从URLClassLoader变成了BuiltinClassLoader,BuiltinClassLoader实现了从模块中加载字节码文件。平台类加载器的存在更多的是为了与老版本的设计方案兼容,自身没有特殊的逻辑

五、运行时数据区

1.程序计数器

(1)程序计数器(Program Counter Register)也叫PC寄存器,每个线程会通过程序计数器记录当前要执行的字节码指令的地址。

(2)在代码执行过程中,程序计数器会记录下一行字节码指令的地址。执行完当前指令之后,虚拟机的执行引擎根据程序计数器执行下一行指令。

(3)程序计数器可以控制程序指令的进行,实现分支、跳转、异常等逻辑。

(4)在多线程执行情况下,Java虚拟机需要通过程序计数器记录CPU切换前解释执行到那一句指令并继续解释运行

(5)内存溢出指的是程序在使用某一块内存区域时,存放的数据需要专用的内存大小超过了虚拟机能提供的内存上限。

(6)因为每个线程只存储一个固定长度的内存地址,程序计数器是不会发生内存溢出的。

2.Java虚拟机栈

(1)Java虚拟机栈(Java Virtual Machine Stack) 采用站的数据结构来管理方法调用中的基本数据,先进后出,每一个方法的调用使用一个栈帧(Stack Frame)来保存。

(2)Java虚拟机栈随着线程的创建而创建,而回收则会在线程的销毁时进行。由于方法可能会在不同线程中执行,每个线程都会包含一个自己的虚拟机栈。

(3)栈帧的组成:

  • 局部变量表
  • 操作数栈
  • 帧数据

(4)局部变量表

  • 局部变量表的作用是在方法执行过程中存放所有的局部变量。编译成字节码文件时就可以确定局部变量表的内容。
  • 栈帧中的局部变量表是一个数组,数组中的每一个位置称之为槽(slot),long和double类型占用两个槽,其他类型占用一个槽。
  • 实例方法中的序号为0的位置存放的是this,指的是当前调用方法的对象,运行时会在内存中存放实例对象的地址。
  • 方法参数也会保存在局部变量表中,其顺序与参数定义的顺序一致。
  • 局部变量表保存的内容有:实例方法的this对象,方法的的参数,方法体中声明的局部变量。
  • 为了节省空间,局部变量表种的槽是可以复用的,一旦某个局部变量不再生效,当前槽就可以再次被使用。

(5)操作数栈

  • 操作数栈是栈帧中虚拟机在执行指令过程中用来存放中间数据的一块区域。它是一种栈式的数据结构,如果一条指令将一个值压入操作数栈,则后面的指令可以弹出并使用该值。
  • 在编译期就可以确定操作数栈的最大深度,从而在执行时正确的分配内存大小。

(6)帧数据

  • 当前类的字节码指令引用了其它类的属性和方法时,需要将符号引用(编号)转换成对应的运行时常量池中的内存地址。动态链接就保存了编号到运行时常量池的映射关系。
  • 方法出口指的是方法在正确或者异常结束时,当前栈帧会被弹出,同时程序计数器应该指向上一个栈帧中的下一条指令的地址。所以在当前栈帧中,需要存储此方法出口的地址。
  • 异常表存放的是代码中异常的处理信息,包含了try代码块和catch代码块执行后跳转到的字节码指令位置。

(7)栈内存溢出

  • Java虚拟机如果栈帧过多,占用内存超过占内存可以分配的最大大就会出现内存溢出。

  • Java虚拟机栈内存溢出时会出现StackOverflowError的错误。

  • 如果不指定栈的大小,JVM将创建一个具有默认大小的栈。大小取决于操作系统和计算机的体系结构。

    image-20240118101044039

  • 修改虚拟机栈的大小,使用虚拟机参数:-Xss栈大小(单位:默认字节,必须是1024倍数、K或k、m或M,g或G)。

  • -XX:ThreadStackSize=1024也可以配置堆栈大小。

  • HotSpot JVM堆栈大小的最大值和最小值有要求:windows(64位)下的JDK8测试最小值为180k,最大值为1024m。

  • 局部变量过多、操作数栈深度过大也会影响栈内存的大小。

3.本地方法栈

(1)Java虚拟机栈存储了Java方法调用时的栈帧,而本地方法存储的是native本地方法的栈帧。

(2)在HotSpot虚拟机中,Java虚拟机栈和本地方法栈上使用了同一个栈空间。本地方法会在栈内存上生成一个栈帧,临时保存方法的参数同时方便出现异常时也把本地方法的栈信息打印出来。

4.堆(线程共享)

(1)一般Java程序中堆内存是空间最大的一块内存区域。创建出来的对象都存在于堆上。

(2)栈上的局部变量表中,可以存放堆上对象的引用。静态变量也可以存放堆对象的引用,通过静态变量就可以实现对象在线程之间共享。

(3)堆内存大小是有上限的,当对象一直向堆中放入对象达到上限之后,就会抛出OutOfMemory错误。

(4)堆空间有三个需要关注的值,used total max:

  • used指的是当前已使用的堆内存
  • total是java虚拟机已经分配的可用堆内存
  • max是java虚拟机可以分配的最大堆内存

(5)堆内存used total max三个值可以通过dashboard命令看到。

​ 手动指定刷新频率(不指定默认5秒一次):dashboard–i刷新频率(毫秒)。

(6)随着堆中的对象增多,当total可以使用的内存即将不足时,java虚拟机会继续分配内存给堆,total值会变大,最多只能与max相等。

(7)设置大小:

  • 要修改堆的大小,可以使用虚拟机参数–Xmx(max最大值)和-Xms(初始的total)。
  • 语法:-Xmx值 -Xms值
  • 单位:字节(默认,必须是1024的倍数)、k或者K(KB)、m或者M(MB)、g或者G(GB)
  • 限制:Xmx必须大于2 MB,Xms必须大于1MB

(8)Java服务端程序开发时,可以将-Xmx和-Xms设置为相同的值,这样在程序启动之后可使用的总内存就是最大内存,而无需向java虚拟机再次申请,减少了申请并分配内存时间上的开销,同时也不会出现内存过剩之后堆收缩的情况。

5.方法区(线程共享)

(1)方法区是存放基础信息的位置,主要包含三部分内容:

  • 类的元信息
  • 运行时常量池
  • 字符串常量池

(2)方法区是用来存储每个类的基本信息(元信息),一般称之为InstanceKlass对象。在类的加载阶段完成。

(3)方法区除了存储类的元信息之外,还存放了运行时常量池。常量池中存放的是字节码中的常量池内容。

​ 字节码文件中通过编号查表的方式找到常量,这种常量池称为静态常量池。当常量池加载到内存中之后,可以通过内存地址快速的定位到常量池中的内容,这种常量池称为运行时常量池。

(4)方法区是《Java虚拟机规范》中设计的虚拟概念,每款Java虚拟机在实现上都各不相同。在Hotspot中:

  • JDK7及之前的版本将方法区存放在堆区域中的永久代空间,堆的大小由虚拟机参数来控制。
  • JDK8及之后的版本将方法区存放在元空间中,元空间位于操作系统维护的直接内存中,默认情况下只要不超过操作系统承受的上限,可以一直分配。

(5)JDK7将方法区存放在堆区域中的永久代空间,堆的大小由虚拟机参数-XX:MaxPermSize=值来控制。

​ JDK8将方法区存放在元空间中,元空间位于操作系统维护的直接内存中,默认情况下只要不超过操作系统承受的上限,可以一直分配。可以使用-XX:MaxMetaspaceSize=值将元空间最大大小进行限制。

(6)字符串常量池

  • 方法区中除了类的元信息、运行时常量池之外,还有一块区域叫字符串常量池(StringTable)。
  • 字符串常量池存储在代码中定义的常量字符串内容。

(7)字符串常量池和运行时常量池的关系:

早期设计时,字符串常量池是属于运行时常量池的一部分,他们存储的位置也是一致的。后续做出了调整,将字符串常量池和运行时常量池做了拆分。

image-20240119091150139

(8)intern()

  • JDK6版本中intern ()方法会把第一次遇到的字符串实例复制到永久代的字符串常量池中,返回的也是永久代里面这个字符串实例的引用。JVM启动时就会把java加入到常量池中。
  • JDK7及之后版本中由于字符串常量池在堆上,所以intern ()方法会把第一次遇到的字符串的引用放入字符串常量池。

(9)静态变量

  • JDK6及之前的版本中,静态变量是存放在方法区中的,也就是永久代。
  • JDK7及之后的版本中,静态变量是存放在堆中的Class对象中,脱离了永久代。

6.直接内存

(1)直接内存(Direct Memory)并不在《Java虚拟机规范》中存在,所以并不属于Java运行时的内存区域。在JDK 1.4中引入了NIO机制,使用了直接内存,主要为了解决以下两个问题:

  • Java堆中的对象如果不再使用要回收,回收时会影响对象的创建和使用。
  • IO操作比如读文件,需要先把文件读入直接内存(缓冲区)再把数据复制到Java堆中。现在直接放入直接内存即可,同时Java堆上维护直接内存的引用,减少了数据复制的开销。写文件也是类似的思路。

(2)要创建直接内存上的数据,可以使用ByteBuffer。

  • 语法:ByteBufferdirectBuffer= ByteBuffer.allocateDirect(size);
  • 注意事项:arthas的memory命令可以查看直接内存大小,属性名direct。

(3)如果需要手动调整直接内存的大小,可以使用-XX:MaxDirectMemorySize=大小

  • 单位k或K表示千字节,m或M表示兆字节,g或G表示千兆字节。默认不设置该参数情况下,JVM自动选择最大分配的大小。

六、自动垃圾回收

1.C/C++的内存管理

(1)在C/C++这类没有自动垃圾回收机制的语言中,一个对象如果不再使用,需要手动释放,否则就会出现内存泄漏。我们称这种释放对象的过程为垃圾回收,而需要程序员编写代码进行回收的方式为手动回收。

(2)内存泄漏指的是不再使用的对象在系统中未被回收,内存泄漏的积累可能会导致内存溢出。

2.Java的内存管理

(1)Java中为了简化对象的释放,引入了自动的垃圾回收(Garbage Collection简称GC)机制。通过垃圾回收器来对不再使用的对象完成自动的回收,垃圾回收器主要负责对堆上的内存进行回收。其他很多现代语言比如C#、Python、Go都拥有自己的垃圾回收器。

(2)线程不共享的部分,都是伴随着线程的创建而创建,线程的销毁而销毁。而方法的栈帧在执行完方法之后就会自动弹出栈并释放掉对应的内存。

3.垃圾回收的对比

(1)自动垃圾回收

  • 优点:降低程序员实现难度、降低对象回收bug的可能性
  • 缺点:程序员无法控制内存回收的及时性

(2)手动垃圾回收

  • 优点:回收及时性高,由程序员把控回收的时机
  • 缺点:编写不当容易出现悬空指针、重复释放、内存泄漏等问题

4.方法区的回收

(1)方法区中能回收的内容主要就是不再使用的类。判定一个类可以被卸载。需要同时满足下面三个条件:

  • 此类所有实例对象都已经被回收,在堆中不存在任何该类的实例对象以及子类对象。
  • 加载该类的类加载器已经被回收。
  • 该类对应的java.lang.Class对象没有在任何地方被引用。

(2)手动触发回收

  • 如果需要手动触发垃圾回收,可以调用System.gc()方法。
  • 语法:System.gc()
  • 注意事项:调用System.gc()方法并不一定会立即回收垃圾,仅仅是向Java虚拟机发送一个垃圾回收的请求,具体是否需要执行垃圾回收Java虚拟机会自行判断。

5.堆回收

(1)Java中的对象是否能被回收,是根据对象是否被引用来决定的。如果对象被引用了,说明该对象还在使用,不允许被回收。

(2)判断堆上的对象有没有被引用的方法:

  • 引用计数法
  • 可达性分析法

(3)引用计数法

  • 引用计数法会为每个对象维护一个引用计数器,当对象被引用时加1,取消引用时减1。(C++中的智能指针就采用了引用计数法)
  • 优点:实现简单
  • 缺点:
    • 每次引用和取消引用都需要维护计数器,对系统性能会有一定的影响
    • 存在循环引用问题,所谓循环引用就是当A引用B,B同时引用A时会出现对象无法回收的问题。

(4)查看垃圾回收日志

  • 查看垃圾回收的信息,使用-verbose:gc参数。
  • 语法:-verbose:gc

image-20240119104715219

(5)可达性分析算法

  • Java使用的是可达性分析算法来判断对象是否可以被回收
  • 可达性分析将对象分为两类:垃圾回收的根对象(GCRoot)和普通对象,对象与对象之间存在引用关系。
  • GC Root对象:
    • 线程Thread对象。
    • 系统类加载器加载的java.lang.Class对象。
    • 监视器对象,用来保存同步锁synchronized关键字持有的对象。
    • 本地方法调用时使用的全局对象。

(6)五种对象引用:

  • 强引用(GCRoot对象对普通对象有引用关系)
  • 软引用
  • 弱引用
  • 虚引用
  • 终结器引用

(7)软引用

  • 软引用相对于强引用是一种比较弱的引用关系,如果一个对象只有软引用关联到它,当程序内存不足时,就会将软引用中的数据进行回收。
  • 在JDK 1.2版之后提供了SoftReference类来实现软引用,软引用常用于缓存中。
  • 软引用执行过程
    • 将对象使用软引用包装起来,new SoftReference<对象类型>(对象)。
    • 内存不足时,虚拟机尝试进行垃圾回收。
    • 如果垃圾回收仍不能解决内存不足的问题,回收软引用中的对象。
    • 如果依然内存不足,抛出OutOfMemory异常。
  • 软引用中的对象如果在内存不足时回收,SoftReference对象本身也需要被回收。如何知道哪些SoftReference对象需要回收呢?SoftReference提供了一套队列机制:
    • 软引用创建时,通过构造器传入引用队列
    • 在软引用中包含的对象被回收时,该软引用对象会被放入引用队列
    • 通过代码遍历引用队列,将SoftReference的强引用删除

(8)弱引用:弱引用的整体机制和软引用基本一致,区别在于弱引用包含的对象在垃圾回收时,不管内存够不够都会直接被回收。在JDK 1.2版之后提供了WeakReference类来实现弱引用,弱引用主要在ThreadLocal中使用。弱引用对象本身也可以使用引用队列进行回收。

(9)虚引用:虚引用也叫幽灵引用/幻影引用,不能通过虚引用对象获取到包含的对象。虚引用唯一的用途是当对象被垃圾回收器回收时可以接收到对应的通知。Java中使用PhantomReference实现了虚引用,直接内存中为了及时知道直接内存对象不再使用,从而回收内存,使用了虚引用来实现。

(10)终结器引用:终结器引用指的是在对象需要被回收时,终结器引用会关联对象并放置在Finalizer类中的引用队列中,在稍后由一条由FinalizerThread线程从队列中获取对象,然后执行对象的finalize方法,在对象第二次被回收时,该对象才真正的被回收。在这个过程中可以在finalize方法中再将自身对象使用强引用关联上,但是不建议这样做。

6.垃圾回收算法

(1)核心思想

  • 找到内存中存活的对象
  • 释放不再存活对象的内存,使得程序能再次利用这部分空间

(2)分类

  • 标记-清除算法
  • 复制算法
  • 标记-整理算法
  • 分代GC

(3)Java垃圾回收过程会通过单独的GC线程来完成,但是不管使用哪一种GC算法,都会有部分阶段需要停止所有的用户线程。这个过程被称之为Stop The World简称STW,如果STW时间过长则会影响用户的使用。

(4)评价标准

  • 吞吐量:吞吐量指的是CPU用于执行用户代码的时间与CPU总执行时间的比值,即吞吐量=执行用户代码时间/(执行用户代码时间+ GC时间)。吞吐量数值越高,垃圾回收的效率就越高。
  • 最大暂停时间:最大暂停时间指的是所有在垃圾回收过程中的STW时间最大值。比如如下的图中,黄色部分的STW就是最大暂停时间,显而易见上面的图比下面的图拥有更少的最大暂停时间。最大暂停时间越短,用户使用系统时受到的影响就越短。
  • 堆使用效率:同垃圾回收算法,对堆内存的使用方式是不同的。比如标记清除算法,可以使用完整的堆内存。而复制算法会将堆内存一分为二,每次只能使用一半内存。从堆使用效率上来说,标记清除算法要优于复制算法。

7.标记清除算法

(1)核心思想

  • 标记阶段,将所有存活的对象进行标记。Java中使用可达性分析算法,从GC Root开始通过引用链遍历出所有存活对象。
  • 清除阶段,从内存中删除没有被标记也就是非存活对象。

(2)优点:实现简单,只需要在第一阶段给每个对象维护标志位,第二阶段删除对象即可。

(3)缺点

  • 碎片化问题由于内存是连续的,所以在对象被删除之后,内存中会出现很多细小的可用内存单元。如果我们需要的是一个比较大的空间,很有可能这些内存单元的大小过小无法进行分配。
  • 分配速度慢。由于内存碎片的存在,需要维护一个空闲链表,极有可能发生每次需要遍历到链表的最后才能获得合适的内存空间。

8.复制算法

(1)核心思想

  • 准备两块空间From空间和To空间,每次在对象分配阶段,只能使用其中一块空间(From空间)。
  • 在垃圾回收GC阶段,将From中存活对象复制到To空间。
  • 将两块空间的From和To名字互换。

(2)优点

  • 吞吐量高:复制算法只需要遍历一次存活对象复制到To空间即可,比标记-整理算法少了一次遍历的过程,因而性能较好,但是不如标记-清除算法,因为标记清除算法不需要进行对象的移动。
  • 不会发生碎片化:复制算法在复制之后就会将对象按顺序放入To空间中,所以对象以外的区域都是可用空间,不存在碎片化内存空间。

(3)缺点

  • 内存使用效率低:每次只能让一半的内存空间来为创建对象使用。

9.标记整理算法

(1)标记整理算法也叫标记压缩算法,是对标记清理算法中容易产生内存碎片问题的一种解决方案。

(2)核心思想

  • 标记阶段,将所有存活的对象进行标记。Java中使用可达性分析算法,从GC Root开始通过引用链遍历出所有存活对象。
  • 整理阶段,将存活对象移动到堆的一端。清理掉存活对象的内存空间。

(3)优点

  • 内存使用效率高:整个堆内存都可以使用,不会像复制算法只能使用半个堆内存。
  • 不会发生碎片化:在整理阶段可以将对象往内存的一侧进行移动,剩下的空间都是可以分配对象的有效空间

(4)缺点

  • 整理阶段的效率不高:整理算法有很多种,比如Lisp2整理算法需要对整个堆中的对象搜索3次,整体性能不佳。可以通过TwoFinger、表格算法、ImmixGC等高效的整理算法优化此阶段的性能

10.分代垃圾回收算法

(1)现代优秀的垃圾回收算法,会将上述描述的垃圾回收算法组合进行使用,其中应用最广的就是分代垃圾回收算法(Generational GC)。

(2)image-20240122165446547

(3)分代回收时,创建出来的对象,首先会被放入Eden伊甸园区。随着对象在Eden区越来越多,如果Eden区满,新创建的对象已经无法放入,就会触发年轻代的GC,称为Minor GC或者Young GC。Minor GC会把需要eden中和From需要回收的对象回收,把没有回收的对象放入To区。

​ 接下来,S0会变成To区,S1变成From区。当eden区满时再往里放入对象,依然会发生Minor GC。此时会回收eden区和S1(from)中的对象,并把eden和from区中剩余的对象放入S0。注意:每次Minor GC中都会为对象记录他的年龄,初始值为0,每次GC完加1。

​ 如果Minor GC后对象的年龄达到阈值(最大15,默认值和垃圾回收器有关),对象就会被晋升至老年代。当老年代中空间不足,无法放入新的对象时,先尝试minor gc如果还是不足,就会触发Full GC,Full GC会对整个堆进行垃圾回收。如果Full GC依然无法回收掉老年代的对象,那么当对象继续放入老年代时,就会抛出Out Of Memory异常。

(4)分代GC算法将堆分成年轻代和老年代主要原因

  • 可以通过调整年轻代和老年代的比例来适应不同类型的应用程序,提高内存的利用率和性能。
  • 新生代和老年代使用不同的垃圾回收算法,新生代一般选择复制算法,老年代可以选择标记-清除和标记-整理算法,由程序员来选择灵活度较高。
  • 分代的设计中允许只回收新生代(minor gc),如果能满足对象分配的要求就不需要对整个堆进行回收(fullgc),STW时间就会减少。

11.垃圾回收器

(1)垃圾回收器的组合关系:垃圾回收器是垃圾回收算法的具体实现。由于垃圾回收器分为年轻代和老年代,除了G1之外其他垃圾回收器必须成对组合进行使用。

image-20240122184831922

(2)年轻代-Serial垃圾回收器

  • Serial是是一种单线程串行回收年轻代的垃圾回收器。
  • 算法:复制算法
  • 优点:单CPU处理器下吞吐量非常出色
  • 缺点:多CPU下吞吐量不如其他垃圾回收器,堆如果偏大会让用户线程处于长时间的等待
  • 适用场景:Java编写的客户端程序或者硬件配置有限的场景

(3)老年代-SerialOld垃圾回收器

  • SerialOld是Serial垃圾回收器的老年代版本,采用单线程串行回收
  • 算法:标记-整理算法
  • 适用场景:与Serial垃圾回收器搭配使用,或者在CMS特殊情况下使用
  • -XX:+UseSerialGC新生代、老年代都使用串行回收器。

(4)年轻代-ParNew垃圾回收器

  • ParNew垃圾回收器本质上是对Serial在多CPU下的优化,使用多线程进行垃圾回收
  • 算法:复制算法
  • 优点:多CPU处理器下停顿时间较短
  • 缺点:吞吐量和停顿时间不如G1,所以在JDK9之后不建议使用
  • 适用场景:JDK8及之前的版本中,与CMS老年代垃圾回收器搭配使用
  • -XX:+UseParNewGC新生代使用ParNew回收器,老年代使用串行回收器

(5)老年代-CMS(Concurrent Mark Sweep)垃圾回收器

  • CMS垃圾回收器关注的是系统的暂停时间,允许用户线程和垃圾回收线程在某些步骤中同时执行,减少了用户线程的等待时间。
  • 算法:标记清除算法
  • 优点:系统由于垃圾回收出现的停顿时间较短,用户体验好
  • 缺点:内存碎片问题、退化问题、浮动垃圾问题
  • 适用场景:大型的互联网系统中用户请求数据量大、频率高的场景比如订单接口、商品接口等
  • 参数:-XX:+UseConcMarkSweepGC
  • 执行步骤
    • 初始标记,用极短的时间标记出GCRoots能直接关联到的对象。
    • 并发标记,标记所有的对象,用户线程不需要暂停。
    • 重新标记,由于并发标记阶段有些对象会发生了变化,存在错标、漏标等情况,需要重新标记。
    • 并发清理,清理死亡的对象,用户线程不需要暂停。

(6)年轻代-Parallel Scavenge垃圾回收器

  • Parallel Scavenge是JDK8默认的年轻代垃圾回收器,多线程并行回收,关注的是系统的吞吐量。具备自动调整堆内存大小的特点。
  • 算法:复制算法
  • 优点:吞吐量高,而且手动可控。为了提高吞吐量,虚拟机会动态调整堆的参数
  • 缺点:不能保证单次的停顿时间
  • 适用场景:后台任务,不需要与用户交互,并且容易产生大量的对象

(7)老年代-Parallel Old垃圾回收器

  • Parallel Old是为Parallel Scavenge收集器设计的老年代版本,利用多线程并发收集。
  • 算法:标记-整理算法
  • 优点:并发收集,在多核CPU下效率较高
  • 缺点:暂停时间会比较长
  • 适用场景:与Parallel Scavenge配套使用
  • 参数:-XX:+UseParallelGC或-XX:+UseParallelOldGC可以使用Parallel Scavenge + Parallel Old这种组合。
  • Parallel Scavenge允许手动设置最大暂停时间和吞吐量。Oracle官方建议在使用这个组合时,不要设置堆内存的最大值,垃圾回收器会根据最大暂停时间和吞吐量自动调整内存大小。
    • 最大暂停时间:-XX:MaxGCPauseMillis=n设置每次垃圾回收时的最大停顿毫秒数
    • 吞吐量:-XX:GCTimeRatio=n设置吞吐量为n(用户线程执行时间= n/n+1)
    • 自动调整内存大小:-XX:+UseAdaptiveSizePolicy设置可以让垃圾回收器根据吞吐量和最大停顿的毫秒数自动调整内存大小

(8)G1垃圾回收器

  • JDK9之后默认的垃圾回收器是G1(Garbage First)垃圾回收器。

  • Parallel Scavenge关注吞吐量,允许用户设置最大暂停时间,但是会减少年轻代可用空间的大小。CMS关注暂停时间,但是吞吐量方面会下降。而G1设计目标就是将上述两种垃圾回收器的优点融合:

    • 支持巨大的堆空间回收,并有较高的吞吐量。
    • 支持多CPU并行垃圾回收。
    • 允许用户设置最大暂停时间。
  • G1的整个堆会被划分成多个大小相等的区域,称之为区Region,区域不要求是连续的。分为Eden、Survivor、Old区。Region的大小通过堆空间大小/2048计算得到,也可以通过参数-XX:G1HeapRegionSize=32m指定(其中32m指定region大小为32M),Region size必须是2的指数幂,取值范围从1M到32M。

    image-20240123202513986

  • G1垃圾回收有两种方式:年轻代回收(Young GC)、混合回收(Mixed GC)

  • 年轻代回收(Young GC),回收Eden区和Survivor区中不用的对象。会导致STW,G1中可以通过参数-XX:MaxGCPauseMillis=n(默认200)设置每次垃圾回收时的最大暂停时间毫秒数,G1垃圾回收器会尽可能地保证暂停时间。

    执行步骤:

    • 新创建的对象会存放在Eden区。当G1判断年轻代区不足(max默认60%),无法分配对象时需要回收时会执行Young GC。
    • 标记出Eden和Survivor区域中的存活对象,
    • 根据配置的最大暂停时间选择某些区域将存活对象复制到一个新的Survivor区中(年龄+1),清空这些区域。G1在进行Young GC的过程中会去记录每次垃圾回收时每个Eden区和Survivor区的平均耗时,以作为下次回收时的参考依据。这样就可以根据配置的最大暂停时间计算出本次回收时最多能回收多少个Region区域了。比如-XX:MaxGCPauseMillis=n(默认200),每个Region回收耗时40ms,那么这次回收最多只能回收4个Region。
    • 后续Young GC时与之前相同,只不过Survivor区中存活对象会被搬运到另一个Survivor区。
    • 当某个存活对象的年龄到达阈值(默认15),将被放入老年代。
    • 部分对象如果大小超过Region的一半,会直接放入老年代,这类老年代被称为Humongous区。比如堆内存是4G,每个Region是2M,只要一个大对象超过了1M就被放入Humongous区,如果对象过大会横跨多个Region。
    • 多次回收之后,会出现很多Old老年代区,此时总堆占有率达到阈值时(-XX:InitiatingHeapOccupancyPercent默认45%)会触发混合回收MixedGC。回收所有年轻代和部分老年代的对象以及大对象区。采用复制算法来完成。
  • 混合回收分为:初始标记(initial mark)、并发标记(concurrent mark)、最终标记(remark或者FinalizeMarking)、并发清理(cleanup)

  • G1对老年代的清理会选择存活度最低的区域来进行回收,这样可以保证回收效率最高,这也是G1(Garbagefirst)名称的由来。

  • G1对老年代的清理会选择存活度最低的区域来进行回收,这样可以保证回收效率最高,这也是G1(Garbagefirst)名称的由来。最后清理阶段使用复制算法,不会产生内存碎片。

  • 注意:如果清理过程中发现没有足够的空Region存放转移的对象,会出现Full GC。单线程执行标记-整理算法,此时会导致用户线程的暂停。所以尽量保证应该用的堆内存有一定多余的空间。

  • 参数1:-XX:+UseG1GC打开G1的开关,JDK9之后默认不需要打开参数2:-XX:MaxGCPauseMillis=毫秒值最大暂停的时间

  • 算法:复制算法

  • 优点:对比较大的堆如超过6G的堆回收时,延迟可控不会产生内存碎片并发标记的SATB算法效率高

  • 缺点:JDK8之前还不够成熟

  • 适用场景:JDK8最新版本、JDK9之后建议默认使用

(9)垃圾回收器的选择

  • JDK8及之前:ParNew + CMS(关注暂停时间)、Parallel Scavenge + Parallel Old (关注吞吐量)、G1(JDK8之前不建议,较大堆并且关注暂停时间)
  • 从JDK9之后,由于G1日趋成熟,JDK默认的垃圾回收器已经修改为G1,所以强烈建议在生产环境上使用G1。

七、内存调优

1.内存溢出和内存泄漏

(1)内存泄漏(memory leak):在Java中如果不再使用一个对象,但是该对象依然在GC ROOT的引用链上,这个对象就不会被垃圾回收器回收,这种情况就称之为内存泄漏。

(2)内存泄漏绝大多数情况都是由堆内存泄漏引起的。

(3)少量的内存泄漏可以容忍,但是如果发生持续的内存泄漏,就像滚雪球雪球越滚越大,不管有多大的内存迟早会被消耗完,最终导致的结果就是内存溢出。但是产生内存溢出并不是只有内存泄漏这一种原因。

posted @ 2024-03-18 20:40  __YJC  阅读(47)  评论(0)    收藏  举报