3.类的加载过程(生命周期)详解
一、概述
在 Java 中数据类型分为基本数据类型和引用数据类型。基本数据类型由虚拟机预先定义,引用数据类型则需要进行类的加载
按照 Java 虚拟机规范,从 Class 文件到加载到内存中的类,到类卸载出内存位置,它的整个生命周期包括如下七个阶段
其中,验证、准备、解析 3 个部分统称为链接(Linking)
2.1、大厂面试题
蚂蚁金服:
描述一下 JVM 加载 Class 文件的原理机制?
一面:类加载过程
百度:
类加载的机制
Java类加载过程?
简述
Java 类加载机制?
腾讯:
JVM 中类加载机制,类加载过程?
滴滴:
JVM 类加载机制
美团:
Java 类加载过程
描述一下
JVM 加载 Class 文件的原理机制
二、过程一:Loading(加载)阶段
2.1、加载完成的操作
2.1.1、加载的理解
所谓加载,简而言之就是将 Java 类的字节码文件加载到机器内存中,内存中构建出 Java 类的原型——类模板对象。所谓类模板对象,其实就是Java 类在 JVM 内存中的一个快照,JVM 将从字节码文件中解析出的常量池、类字段、类方法等信息存储到模板中,这样 JVM 在运行期便能通过类模板而获取 Java 类中的任意信息,能够对 Java类的成员变量进行遍历,也能进行 Java
方法的调用。
反射的机制即基于这一基础。如果JVM 没有将 Java 类的声明信息存储起来,则 JVM 在运行期也无法反射
2.1.2、加载完成的操作
加载阶段,简言之,查找并加载类的二进制数据,生成Class 的实例。
在加载类时,Java 虚拟机必须完成以下 3 件事情:
-
通过类的全名,获取类的二进制数据流
-
解析类的二进制数据流为方法区内的数据结构(Java类模型)
-
创建 java.lang.Class 类的实例,表示该类型。作为方法区这个类的各种数据
的访问入口
2.2、二进制流的获取方式
对于类的二进制数据流,虚拟机可以通过多种途径产生或获得。
-
虚拟机可能通过文件系统读入一个 Class 后缀的文件(最常见)
-
读入 jar、zip 等归档数据包,提取类文件
-
事先存放在数据库中的类的二进制数据
-
使用类似于 HTTP之类的协议通过网络进行加载(序列化与反序列化)
-
在运行时生成一段Class 的二进制信息等
在获取到类的二进制信息后,Java 虚拟机就会处理这些数据,并最终转为一个java.lang.Class 的实例
如果输入数据不是 ClassFile 的结构,则会抛出 ClassFormatError
2.3、类模型与 Class 实例的位置
2.3.1、类模型的位置
加载的类在 JVM 中创建相应的类结构,类结构会存储在方法区(JDK 1.8 之前:永久代;JDK 1.8 之后:元空间)
2.3.2、Class实例的位置
类将 .class 文件加载至元空间后,会在堆中创建一个 java.lang.Class 对象,用来封装类位于方法区内的数据结构,该 Class 对象是在加载类的过程中创建的,每个类都对应有一个 Class 类型的对象
外部可以通过访问代表 Order 类的 Class对象来获取 Order 的类数据结构
2.4、数组类的加载
创建数组类的情况稍微有些特殊,因为数组类本身并不是由类加载器负责创建,而是由 JVM 在运行时根据需要而直接创建的,但数组的元素类型仍然需要依靠类加载器去创建。
创建数组类(下述简称 A)的过程
-
如果数组的元素类型是引用类型,那么就遵循定义的加载过程递归加载和创建数组 A 的元素类型
-
JVM 使用指定的元素类型和数组唯独来创建新的数组类
注意:如果数组的元素类型是引用类型,数组类的可访问性就由元素类型的可访问性决定。否则数组类的可访问性将被缺省定义为 public
三、过程二:Linking(链接)阶段
3.1、环节 1::链接阶段之 Verification (验证)
当类加载到系统后,就开始链接操作,验证是链接操作的第一步。
它的目的是保证加载的字节码是合法、合理并符合规范的
验证的步骤比较复杂,实际要验证的项目也很繁多,大体上 Java 虚拟机需
要做以下检查,如图所示:
整体说明:
验证的内容则涵盖了类数据信息的格式验证、语义检查、字节码验证,以及符号引用验证等
-
其中格式验证会和加载阶段一起执行。验证通过之后,类加载器才会成功将类的二进制数据信息加载到方法区中
-
格式验证之外的验证操作将会在方法区中进行
注意:链接阶段的验证虽然拖慢了加载速度,但是它避免了在字节码运行时还需要进行各种检查
具体说明:
1、格式验证:
- 是否以魔数 0xCAFEBABE 开头,主版本和副版本号是否在当前Java虚拟机的支持范围内,数据中每一个项是否都拥有正确的长度等
2、语义检查:凡在语义上不符合规范的,虚拟机也不会给予验证通过
-
1、是否所有的类都有父类的存在(在 Java 里,除了 Object 外,其他类都应该有父类)
-
2、是否一些被定义为 final 的方法或者类被重写或继承了
-
3、非抽象类是否实现了所有抽象方法或者接口方法
-
4、是否存在不兼容的方法(比如方法的签名除了返回值不同,其他都一样,这种方法会让虚拟机无从下手调度;absract 情况下的方法,就不能是 final 的了)
3、字节码验证:试图通过对字节码流的分析,判断字节码是否可以被正确地执行。
-
1、在字节码的执行过程中,是否会跳转到一条不存在的指令
-
2、函数的调用是否传递了正确类型的参数
-
3、变量的赋值是不是给了正确的数据类型等
注意:在前面 3 次检查中,已经排除了文件格式错误、语义错误以及字节码的不正确性。但是依然不能确保类是没有问题的
- 4、校验器还将进行符号引用的验证。Class 文件在其常量池会通过字符串记录自己将要使用的其他类或者方法。因此,在验证阶段,虚拟机就会检查这些类或者方法确实是存在的,并且当前类有权限访问这些数据,如果一个需要使用类无法在系统中找到,则会抛出 NoClassDefFoundError,如果一个方法无法被找到,则会抛出 NoSuchMethdError 此阶段在解析环节才会执行
3.2、环节2:链接阶段之 Preparation (准备、重要)
准备阶段(Preparation),简言之,为类的静态变量分配内存,并将其初始化为默认值
注意:Java 并不支持 boolean 类型,对于 boolean 类型,内部实现是int,由于 int 的默认值是 0,故对应的,boolean 的默认值就是 false
注意:
1、这里不包含基本数据类型的字段用 static final 修饰的情况,因为 final在编译的时候就会分配了,准备阶段会显式赋值
2、注意这里不会为实例变量分配初始化,类变量会分配在方法区中,而实例变量是会随着对象一起分配到 Java 堆中
3、在这个阶段不会像初始化阶段中那样会有初始化或者代码被执行
小总结配合代码:
-
基本数据类型:
-
非 final 修饰的变量,在准备环节进行默认初始化赋值
-
final 修饰以后,在准备环节直接进行显式赋值(不太准确)
-
拓展:如果使用字面量的方式定义一个字符串的常量的话,也是在准备环节直接进行显式赋值
public class LinkingTest {
private static long id;
private static final int num = 1;
public static final String constStr = "CONST";
public static final String constStr1 = new String("CONST");
}
3.3、环节 3:链接阶段之 Resolution (解析)
3.3.1、具体描述
在解析阶段(Resolution),简言之,将类、接口、字段和方法的符号引用转为直接引用
通过解析操作,符号引用就可以转变为目标方法在类中方法表中的位置,从而使得方法被成功调用
3.3.2、小结
-
所谓解析就是将符号引用转为直接引用,也就是得到类、字段、方法在内存中的指针或者偏移量。
-
因此,可以说,如果直接引用存在,那么可以肯定系统中存在该类、方法或者字段。
-
但只存在符号引用,不能确定系统中一定存在该结构不过 Java 虚拟机规范并没有明确要求解析阶段一定要按照顺序执行。
3.3.3、字符串复习
当在 Java 代码中直接使用字符串常量时,就会在类中出现 CONSTANT_String,它表示字符串常量,并且会引用一个 CONSTANT_UTF8 的常量项。在 Java 虚拟机内部运行中的常量池,会维护一张字符串拘留表(intern),它会保存所有出现过的字符串常量,并且没有重复项。
四、过程三:Initialization(初始化)阶段(重点)
初始化阶段,简言之,为类的静态变量赋予正确的初始值
4.1、具体描述
类的初始化是类装载的最后一个阶段。如果前面的步骤都没有问题,那么表示类可以顺利装载到系统中。此时,类才会开始执行 Java 字节码。(即:到了初始化阶段,才真正开始执行类中定义的 Java 程序代码)
初始化阶段的重要工作是执行类的初始化方法:(client)方法
-
该方法仅能由 Java 编译器生成并由 JVM 调用,程序开发者无法自定义一个同名的方法,更无法直接在 Java 程序中调用该方法,虽然该方法也是由字节码指令所组成
-
它是类静态成员的赋值语句以及 static 语句块合并产生的
4.2、说明
- 1、在加载一个类之前,虚拟机总是会试图加载该类的父类,因此父类的 总是在子类 之前被调用,也就是说,父类的static 块优先级高于子类
- 2、Java 编译器并不会为所有的类都产生<clinit>() 初始化方法。哪些类在编译为字节码后,字节码文件中将不会包含 <clinit>()方法?
1、一个类中并没有声明任何的类变量,也没有静态代码块时
2、一个类中声明类变量,但是没有明确使用类变量的初始化语句以及静态代码块来执行初始化操作时
3、一个类中包含 static final 修饰的基本数据类型的字段,这些类字段初始化语句采用编译时常量表达式
4.3、static 与 final 的搭配问题
** 问:哪些场景下,Java 编译器就不会生成<clinit>()方法**
public class InitializationTest1 {
场景 1:对应非静态的字段,不管是否进行了显式赋值,都不会生成<clinit>()
方法
public int num = 1;
场景 2:静态的字段,没有显式的赋值,不会生成<clinit>()方法
public static int num1;
场景 3:比如对于声明为 static final 的基本数据类型的字段,不管是否进行
了显式赋值,都不会生成<clinit>()方法
public static final int num2 = 1;
}
问:使用 static + final 修饰的字段的显式赋值的操作,到底是在哪个阶段进行的赋值?
- 情况 1:在链接阶段的准备环节赋值
- 情况 2:在初始化阶段(client)方法中赋值
结论:
在链接阶段的准备环节赋值的情况:
1、对于基本数据类型的字段来说,如果使用 static final 修饰,则显式赋值(直接赋值常量,而非调用方法)通常是在链接阶段的准备环节进行
2、对于 String 来说,如果使用字面量的方式赋值,使用** static final **修饰的话,则显式赋值通常是在链接阶段的准备环节进行
在初始化阶段<clinit>()中赋值的情况 :
排除上述的在准备环节赋值的情况之外的情况
最终结论:
使用 static + final 修饰,且显示赋值中不涉及到方法或构造器调用的基本数据类型或 String 类型的显式赋值,是在链接阶段的准备环节进行
在初始化阶段<clinit>()中赋值
public static int a = 1;
在链接阶段的准备环节赋值
public static final int INT_CONSTANT = 10;
在初始化阶段<clinit>()中赋值
public static final Integer INTEGER_CONSTANT1=Integer.valueOf(100);
在初始化阶段<clinit>()中赋值
public static Integer INTEGER_CONSTANT2 = Integer.valueOf(1000);
在链接阶段的准备环节赋值
public static final String s0 = "helloworld0";
在 初 始 化 阶 段<clinit>()中赋值
public static final String s1 = new String("helloworld1");
4.4、<clinit>()的线程安全问题
1、对于<clinit> () 方法的调用,也就是类的初始化,虚拟机会在内部确保其多线程环境中的安全性
2、虚拟机会保证一个类的 <clinit> () 方法在多线程环境中被正确地加锁、同步,如果多个线程同时去初始化一个类,那么只会有一个线程去执行这个类的 <clinit> () 方法,其他线程都需要阻塞等待,直到活动线程执行 <clinit> () 方法完毕
3、正是因为函数 <clinit> () 带锁线程安全的,因此,如果一个在类的 () 方法中有耗时很长的操作,就可能造成多个线程阻塞,引发死锁。并且这种死锁是很难发现的,因为看起来它们并没有可用的锁信息
4、如果之前的线程成功加载了类,则等在队列中的线程就没有机会再执行 <clinit> () 方法了。那么,当需要使用这个类时,虚拟机会直接返回给它已经准备好的信息
4.5、 类的初始化情况:主动使用 vs被动使用
Java 程序对类的使用分为两种:主动使用 和 被动使用
4.5.1、主动使用
-
1、当创建一个类的实例时,比如使用** new 关键字,或者通过反射、克隆、反序列化**
-
2、当调用类的静态方法时,即当使用了字节码 invokestatic 指令
-
3、当使用类、接口的静态字段时(final 修饰特殊考虑),比如,使用 getstatic 或者 putsttic 指令。(对应访问变量、赋值变量操作)
-
4、当 使 用java.lang.reflect 包 中 的 方 法 反 射 类 的 方 法 时 。 比 如 :Class.forname("com.atguigu.java.Test")
-
5、当初始化子类时,如果发现其分类还没有进行过初始化,则需要先触发其父类的初始化
-
6、如果一个接口定义了 default 方法,那么直接实现或者间接实现该接口的类的初始化,该接口要在其之前被初始化
-
7、当虚拟机启动时,用户需要指定一个要执行的主类(包含 main() 方法的那个类),虚拟机会先初始化这个主类
补充_针对5:
当 Java 虚拟机初始化一个类时,要求它的所有父类都已经被初始化,但是这条规则并不适用于接口:
-
在初始化一个类时,并不会先初始化它所实现的接口
-
在初始化一个接口时,并不会先初始化它的父接口
因此,一个父接口并不会因为它的子接口或者实现类的初始化而初始化,只有当程序首次使用特定接口的静态字段时,才会导致该接口的初始化
补充_针对7:
- JVM 启动的时候通过引导类加载器加载一个初始类。这个类在调用 public static void main(String[] args) 方法之前被链接和初始化。这个方法的执行将依次导致所需的类的加载、链接和初始化
4.5.2、 被动使用
除了以上的情况属于主动使用,其他的情况均属于被动使用。被动使用不会引起类的初始化
也就是说:并不是在代码中出现的类,就一定会被加载或者初始化。如果不符合主动使用的条件,类就不会初始化
-
1、当访问一个静态字段时,只有真正声明这个字段的类才会被初始化
-
2、当通过子类引用父类的静态变量,不会导致子类初始化
-
3、通过数组定义类引用,不会触发此类的初始化
-
4、引用常量不会触发此类或接口的初始化。因为常量在链接阶段就已经被显式赋值了
-
5、调用 ClassLoader 类的 loadClass() 方法加载一个类,并不是对类的主动使用, 不会导致类的初始化
补充_JVM参数:
如果针对代码,设置参数 -XX:+TraceClassLoading,可以追踪类的加载信息并打印出来
五、过程四:类的Using(使用)
万事俱备,,只欠东风。。
六、过程五:累的Unloading(卸载)
6.1、类、类的加载器、类的实例之间的引用关系
在类加载器的内部实现中, 用一个 Java 集合来存放所加载类的引用。另一方面,一个 Class 对象总是会引用它的类加载器,调用 Class 对象的getClassLoader() 方法,就能获得它的类加载器。由此可见, 代表某个类的 Class实例与其类的加载器之间为双向关联关系
一个类的实例总是引用代表这个类的 Class 对象。在 Object 类中定义了getClass()方法,这个方法返回代表对象所属类的 Class 对象的引用。此外,所有的 Java类都有一个静态属性 Class,它引用代表这个类的 Class 对象
6.2、类的生命周期
当Sample 类被加载、链接和初始化后,它的生命周期就开始了。当代表Sample类的 Class 对象不再被引用,即不可触及时,Class 对象就会结束生命周期,Sample 类在方法区内的数据也会被卸载,从而结束 Sample 类的生命周期
一个类何时结束生命周期,取决于代表它的 Class 对象何时结束生命周期
6.3、具体例子
GC-ROOTS

1、Loader1 变量和 obj 变量间接应用代表 Sample 类的 Class 对象,而objClass 变量则直接引用它
2、如果程序运行过程中,将上图左侧三个引用变量都置为null,此时 Sample对象结束生命周期,MyClassLoader 对象结束生命周期,代表Sample 类的 Class对象也结束生命周期,Sample 类在方法区内的二进制数据被卸载
3、当再次有需要时,会检查 Sample类的 Class 对象是否存在,如果存在会直接使用,不再重新加载;如果不存在Sample 类会被重新加载,在 Java 虚拟机的堆区会生成一个新的代表 Sample 类的 Class 实例(可以通过哈希码查看是否是同一个实例)
6.4、类的卸载
1、启动类(引导类)加载器加载的类型在整个运行期间是不可能被卸载的(JVM 和 JSL规范)
2、被系统类加载器和扩展类加载器加载的类型在运行期间不太可能被卸载,因为系统类加载器实例或者扩展类的实例基本上在整个运行期间总能直接或者间接的访问的到,其达到 unreachable 的可能性极小
3、被开发者自定义的类加载器实例加载的类型只有在很简单的上下文环境中才能被卸载,而且一般还要借助于强制调用虚拟机的垃圾收集功能才可以做到。可以预想,稍微复杂点的应用场景(比如:很多时候用户在开发自定义类的加载器实例的时候采用缓存的策略以提高系统性能),被加载的类型在运行期间也是几乎不太可能被卸载的(至少卸载的时间是不确定的)
综合:
一个已经加载的类型被卸载的几率很小至少被卸载的时间是不确定的。同时我们可以看的出来,开发者在开发代码时候,不应该对虚拟机的类型卸载做任何假设的前提下,来实现系统中的特定功能
6.5、回顾:方法区的垃圾回收
方法区的垃圾收集主要回收两部分内容:常量池中废弃的常量和不再使用的类型
- HotSpot 虚拟机对常量池的回收策略是很明确的,只要常量池中的常量没有被任何地方引用,就可以被回收
判定一个常量是否"废弃"还是相对简单,而要判定一个类型是否属于** "不再被使用的类" **的条件就比较苛刻了。需要同时满足下面三个条件:
-
该类所有的实例都已经被回收。也就是 Java 堆中不存在该类及其任何派生子类的实例
-
加载该类的类加载器已经被回收。这个条件除非是经过精心设计的可替换类加载器的场景,如 OSGI、JSP 的重加载等,否则通常是很难达成的
-
该类对应的 java.lang.Class 对象没有在任何地方被引用,无法在任何地方通过反射访问该类的方法
Java 虚拟机被允许对满足上述三个条件的无用类进行回收,这里说的仅仅是"被允许",而并不是和对象一样,没有引用了就必然会回收







浙公网安备 33010602011771号