第7章 虚拟机类加载机制

第7章 虚拟机类加载机制

一、概述

​ 虚拟机把描述类的数据从Class文件加载到内存,并对数据进行校验,转换解析和初始化,最终形成可以被虚拟机直接使用的Java类型,这就是虚拟机的类加载机制。

​ Java中语言里,类型的加载,连接和初始化都是在程序运行期间完成的,这种策略虽然会令类加载时稍微增加一些性能开销,但是会为Java应用程序提供高度的灵活性,Java里天生可动态扩展的语言特性就是依赖运行期动态加载和动态连接这个特点实现的.

二、类加载的时机

​ 类从被加载到虚拟机内存中开始,到卸载出内存为止,它的整个生命周期包括:加载(Loading)、验证(Verification)、准备(Preparation)、解析(Resolution)、初始化(Initialization)、使用(Using)和卸载(Unloading)7个阶段。其中验证、准备、解析3个部分统称为连接(Linking)、这7个阶段的发生顺序如图所示。

​ 加载、验证、准备、初始化和卸载这5个阶段的顺序是确定的,类的加载过程必须按照这种顺序按部就班地开始,而解析阶段则不一定:它在某些情况下可以在初始化之后再按部就班地开始,这是为了支持Java语言的运行时绑定。

​ 什么情况下需要开始类加载过程的第一个阶段?Java虚拟机规范并没有进行强制约束,但对于初始化阶段,虚拟机规范则严格规定了有且只有5种情况必须对类进行“初始化”(加载、验证、准备自然需要在此之前开始):

​ 1)遇到new、getstatic、putstatic或invokestatic这4条字节码指令时,如果类没有进行初始化,则需要先触发其初始化。生成这4条指令的最常见Java代码场景是:使用new关键字实例化对象的时候、读取或设置一个类的静态字段的时候,以及调用一个类的静态方法的时候。

​ 2)使用java.lang.reflect包的方法对类进行反射调用的时候,如果类没有进行过初始化,则需要先触发其初始化。

​ 3)当初始化一个类的时候,如果其父类还没有进行过初始化,则需要先触发其父类的初始化。

​ 4)当虚拟机启动时,用户需要指定一个要执行的主类(包含main方法的类),虚拟机会先初始化这个主类。

​ 5)当使用JDK1.7动态语言支持时,如果一个java.lang.invoke.MethodHandle实例最后解析结果REF_getStatic、REF_putStatic、REF_invokeStatic的方法句柄,并且这个方法句柄对应的类没有初始化,则需要先触发其初始化。

​ 这五种场景的行为称为对一个类进行主动引用。除此之外,所有引用类的方式都不会触发初始化,称为被动引用。

三、类加载的过程

1.加载

​ “加载”是“类加载”过程的一个阶段,在加载阶段,虚拟机需要完成以下3件事情:

  • 通过一个类的全限定类名来获取定义此类的二进制字节流。
  • 将这个字节流所代表的的静态存储结构转化为方法区的运行时数据结构。
  • 在内存中生成一个代表这个类的java.lang.Class对象,作为方法区这个类的各种数据的访问入口

​ 对于数组类而言,情况与非数组类有所不同,数组类本身不通过类加载器创建,它是由java虚拟机直接创建的。但数组类与类加载器仍然有很密切的关系,因为数组类元素类型最终是要靠类加载器去创建,一个数组类创建过程遵循以下规则:

  • 如果数组的组件类型是引用类型,那就递归采用加载过程加载这个组件类型,数组将在加载该组件类型的类加载器的类名称空间上被标识(一个类必须与类加载器一起确定唯一性)
  • 如果数组的组件类型不是引用类型(int[]数组),Java虚拟机会把数组标记为与引导类加载器关联。
  • 数组类的可见性与它的组件类型的可见性一致,如果组件类型不是引用类型,那数组类的可见性将默认为public。

​ 加载阶段完成后,虚拟机外部的二进制字节流就按照虚拟机所需要的格式存储在方法区之中,方法区的数据存储格式由虚拟机实现自行定义。然后在内存中实例化一个java.lang.Class对象(HotSpot虚拟机中,Class对象比较特殊,虽然是对象,但是存放在方法区中),这个对象将作为程序访问方法区中这些类型数据的外部接口。

​ 加载阶段与连接阶段的部分内容(如一部分字节码文件格式验证动作)是交叉进行的,加载阶段尚未完成,连接阶段可能已经开始,但这些夹在加载阶段之中进行的动作,仍然属于连接阶段的内容,这两个阶段的开始时间仍然保持着固定的先后顺序。

2.验证

​ 验证是连接阶段的第一步,这一阶段的目的是为了确保Class文件的字节流中包含的信息符合当前虚拟机的要求,并且不会危害虚拟机自身的安全。

​ Java语言本身是相对安全的语言,使用纯粹的Java代码无法做到诸如访问数组边界意外的数据、将一个对象转型为它并未实现的类型、跳转到不存在的代码行之类的事情,如果这样做了,编译器将拒绝编译。Class文件并不一定非要由Java源码编译而来,可以使用任何途径产生,在字节码语言层面上,上述java代码无法做到的事情都是可以实现的。虚拟机如果不检查输入的字节流,对其完全信任的话,很可能会因为载入了有害的字节流而导致系统的崩溃,所以验证是虚拟机对自身保护的一项重要工作。

​ 验证阶段是否严谨,决定了java虚拟机是否能够承受恶意代码的攻击,从执行性能的角度上讲,验证阶段的工作量在虚拟机的类加载子系统中又占了相当大的一部分。整体上看,验证阶段大致会完成4个阶段的检验动作:文件格式验证、元数据验证、字节码验证、符号引用验证。

3.准备

​ 准备阶段是正式为变量分配内存并设置类变量初始值的阶段,这些变量所使用的内存都将在方法区中进行分配。这个阶段中有两个容易产生混淆的概念,这时候进行内存分配的仅包括类变量(static修饰的变量),而不包括实例变量,实例变量将会在对象实例化时随着对象一起分配在java堆中。其次,这里所说的初始值“通常情况”下是数据类型的零值

​ 一些“特殊情况”:如果类字段的字段属性表存在ConstantValue属性,那在准备阶段变量value就会被初始化为ConstantValue所指定的值,假设类变量定义为public static final int value = 123;

编译时javac会为value生成ConstantValue属性,在准备阶段虚拟机就会根据ConstantValue的设置将value赋值为123。

4.解析

​ 解析阶段是虚拟机将常量池内的符号引用替换为直接引用的过程。

  • 符号引用(Symbolic References):以一组符号来描述所引用的目标,符号可以是任何形式的字面量,只要使用时能无歧义的定位到目标即可。符号引用与虚拟机实现的内存布局无关,引用的目标并不一定已经加载到内存中。各种虚拟机实现的内存布局可以不相同,但是它们接受的符号引用必须都是一致的,因为符号引用的字面量形式明确定义在Java虚拟机规范的Class文件格式中。
  • 直接引用(Direct References):可以直接指向目标的指针、相对偏移量或是一个能间接定位到目标的句柄。直接引用是和虚拟机实现的内存布局相关的,同一个符号引用在不同虚拟机实例上翻译出来的直接引用一般不相同,如果有直接引用,那引用的目标必定已经在内存中存在。

5.初始化

​ 类初始化阶段是类加载过程的最后一步,前面的类加载过程中,除了在加载阶段用户应用程序可以通过自定义类加载器之外,其余完全由虚拟机主导和控制。到了初始化阶段,才真正开始执行类中定义的Java程序代码。

​ 在准备阶段,变量已经赋过一次初始值,而在初始化阶段,则根据程序员通过程序制定的主观计划去初始化类变量和其他资源。

四、类加载器

​ 虚拟机设计团队把类加载阶段中“通过一个类的全限定名来获取描述此类的二进制字节流”这个动作放到Java虚拟机外部去实现,以便让程序自己决定如何去获取所需要的类,实现这个动作的代码模块称为“类加载器”。

1.类与类加载器

​ 类加载器虽然只用于实现类的加载动作,但它在Java程序中起到的作用却远远不限于类加载阶段。对于任意一个类,都需要由加载它的类加载器和这个类本身一同确立其在Java虚拟机中的唯一性,每一个类加载器都拥有一个独立的类名称空间。比较两个类是否“相等”,只有在这两个类是由同一个类加载器加载的前提下才有意义,否则,即使这两个类来源于同一个Class文件,被同一个虚拟机加载,只要加载它们的类加载器不同,那这两个类就必定不相等。

​ 这里所指的“相等”,包括代表类的Class对象的equals方法,isAssignableFrom方法、isInstance方法返回结果,也包括使用instanceof关键字做对象所属关系判定等情况。

2.双亲委派模型

​ 从Java虚拟机的角度来讲,只存在两种不同的类加载器:一种是启动类加载器(Bootstrap ClassLoader),这个类加载器由C++语言实现,是虚拟机的一部分;另一种就是所有其他的类加载器,这些类加载器都是由Java语言实现,独立于虚拟机外部,并且全都继承自抽象类java.lang.ClassLoader。

​ 从Java开发人员的角度来看,类加载器还可以划分的更细致:

  • 启动类加载器(Bootstrap ClassLoader):这个类加载器负责将存放在<JAVA_HOME>\lib目录中的,或者被-Xbootclasspath参数所指定路径中的被虚拟机识别的类库加载到虚拟机内存中。启动类加载器无法被Java程序直接引用,用户在编写自定义类加载器时,如果需要把加载请求委派给引导类加载器,直接使用null代替即可。
  • 扩展类加载器(Extension ClassLoader):这个加载器由sun.misc.Launcher$ExtClassLoader实现,它负责加载<JAVA_HOME>\lib\ext目录中的,或者被java.ext.dirs系统变量指定的路径中的类库,开发者可以直接使用扩展类加载器
  • 应用程序类加载器(Application ClassLoader):这个类由sun.misc.Launcher$AppClassLoader实现.由于这个类加载器是ClassLoader中的getSystemClassLoader方法的返回值,所以一般也称为系统类加载器,它负责加载用户类路径(ClassPath)上所指定的类库,开发者可以直接使用这个类加载器,如果应用程序中没有自定义过类加载器,一般情况下这个就是程序中默认的类加载器。

​ 上图中展示的这种类加载器之间的层次关系,称为类加载器的双亲委派模型(Parents Delegation Model)。双亲委派模型要求除了顶层的启动类加载器外,其余的类加载器都应当有自己的父类加载器,这里类加载器的父子关系一般不会以继承(Inheritace)的关系来实现,而是都是用组合(Composition)关系来复用父加载器的代码。

​ 双亲委派模型的工作过程是:如果一个类加载器收到了类加载的请求,它首先不会自己去尝试加载这个类,而是把这个请求委派给父类加载器去完成,每一个层次的类加载器都是如此,因此所有的加载请求最终都会传送到启动类加载器中,只有当父加载器反馈自己无法完成这个加载请求时,子加载器才会尝试自己去加载。

​ 使用双亲委派模型来组织类加载器之间的关系,有一个显而易见的好处就是Java类随着它的类加载器一起具备了一种带有优先级的层器关系,例如Object类它存放在rt.jar之中,无论哪个类加载器要加载这个类,最终都是委派给处于模型顶端的启动类加载器进行加载,因此Object类在程序各个类加载器环境中都是同一个类,相反,如果没有双亲委派模型,由各个类加载器自行加载的话,如果用户自己编写了一个Object类并放在classpath中,那系统中将出现多个不同的Object类,应用程序也会变得混乱。

​ 双亲委派模型对于保证Java程序的稳定运行很重要但实现却非常简单,先检查是否已经被加载过,如果没有就调用父加载器的loadClass方法,若父加载器为空则默认使用启动类加载器作为父加载器,如果父加载器加载失败,抛出ClassNotFoundException后,在调用自己的loadClass方法进行加载。

3.破坏双亲委派模型

​ 线程上下文类加载器(Thread Context ClassLoader)。这个类加载器可以通过java.lang.Thread类的setContextClassLoader方法进行设置,如果创建线程时还未设置,他将会从父线程中继承一个,如果在应用程序的全局范围内都没有设置过,那这个类加载器默认就是应用程序类加载器。

​ 有了线程上下文类加载器,就可以父类加载器请求子类加载器完成类加载动作,这种行为就是打通了双亲委派模型的层次结构来逆向使用类加载器,实际上已经违背了双亲委派模型的一般性原则。

posted @ 2019-06-28 11:44  故事而已zzz  阅读(131)  评论(0编辑  收藏  举报