Understanding the JVM：类加载及执行子系统的案例与实战

前言

这一章是给出了几个例子说明前面几章讲过的内容。我觉得关于tomcat那个例子对我来说太有用了。正好被这个问题困扰，然后今天看完瞬间感觉豁然开朗。而这一章关注点有：

类加载器
字节码生成

因为平时跟字节码打交道的场景不多，而最近研究类加载器算是比较多。所以，这章我主要关注的就是类加载器相关的东西。

一、类加载器实例之——Tomcat

主流的Java Web服务器，如Tomcat、Jetty、WebLogic、WebSphere，都实现了自己定义的类加载器（一般都不止一个）。因为一个功能健全的Web服务器，要解决如下问题：

部署在同一个服务器上的两个Web应用程序所使用的Java类库可以使用相互隔离。这是最基本的要求，因为不同应用可能依赖同一个类库的不同版本，不能要求每个类库在一个服务器只有一个版本，应当保证两个应用程序的类库可以互相独立使用
部署在同一个服务器上的两个Web应用程序所使用的Java类库可以互相共享。这个也很正常，比如我有10个应用程序，都用到Spring，那么我不可能放10份Spring相关的类库吧。
服务器需要尽可能地保证自身的安全不受部署的Web应用程序影响。目前很多Java Web服务器也是Java实现的，因此肯定有库依赖问题。一般来说，基于安全考虑，服务器所使用的类库应该和应用程序的类库相互独立
支持Jsp应用的Web服务器，十有八九都需要支持HotSwap功能。因为Jsp本质上还是需要被编译成.class文件才能被JVM执行，但Jsp在运行时被修改的概率比较大。因此主流Web服务器都会支持Jsp生成类的热替换

由于以上几个要求，如果只有一个CLASSPATH就很难实现了。所以各种Web服务器都会提供好几个CLASSPATH路径供用户存放第三方类库，这些路径一般都以lib或者classes命名。被放置在不同目录的类库，具备不同的访问范围和服务对象。通常而言，每一个目录都会有一个对应的自定义类加载器去加载设置在里面的Java类库。那么我们就以Tomcat为例来看一下。

1. Tomcat目录结构

在Tomcat目录结构中，有三组目录可以存放Java类库，另外加上应用程序自身的目录，一共四组：

放置在/common目录中：类库可被Tomcat和所有Web应用程序共同使用
放置在/server目录中：类库只能被Tomcat使用
放置在/shared目录中：类库可以Web应用程序共同使用，但是Tomcat不能使用
放置在/webapp/WEB-INF目录中：仅仅可以被这个Web应用程序使用，Tomcat和其它Web应用程序不能使用

为了支持这套目录，并对目录内的类库进行加载和隔离，Tomcat自定义了几个类加载器，这些类加载器按照经典的双亲委派模型来实现，如下图所示：

Note：上述 JVM 中的 App ClassLoader，是特殊的应用类加载器，也称为 Sys ClassLoader 系统类加载器。

上述的类加载器：

其中最上层的3个是JVM的类加载器（因为Tomcat也相当于一个Java程序，它只是将程序员写的Java程序做了一个封装）
CommonClassLoader：对应/common目录
CatalinaClassLoader：对应/server目录
SharedClassLoader：对应/shared目录
WebAppClassLoader：对应/webapp/WEB-INF目录

其中WebAppClassLoader和JsperClassLoader会存在多个实例，每一个WebApp对应一个WebApp类加载器，每一个Jsp文件对应一个Jsp类加载器。

上面的图我们也能看出它们之间的隔离性：

Common类加载器加载的类可以被Catalina类加载器和Shared类加载器使用
Catalina类加载器和Shared类加载器相互隔离
WebApp类加载器可以使用Shared类加载器加载的类
各个WebApp类加载器之间加载的类相互隔离
各个Jsp类加载器加载的仅仅是这个Jsp文件编译出来的那个.class文件，它出现的目的就是被丢弃，如果修改，就会新建一个Jsp类加载器替换原来的那个，实现HotSwap

2. Tomcat版本升级

对于Tomcat的6.x版本，只有指定了conf/catalina.properties配置文件中的server.loader和share.loader才会真正建立CatalinaClassLoader和SharedClassLoader的实例，否则会以CommonClassLoader代替。而默认的配置里面是没有设置这两个loader的，所以Tomcat 6.x顺理成章的把/commmon、/server、/shared这三个目录合并为一个/lib目录。这是Tomcat团队为了简化大多数部署场景所做的一项改进，如果默认设置不能满足需求，再通过修改配置完成3种类加载器的协同分工。

二、OSGi：灵活的类加载器结构

传说Java社区流传这样一句话：学习JEE规范，去看JBoss源码；学习类加载器，去看OSGi源码。可见，OSGi的类加载器机制确实值得学习。

OSGi（Open Service Gateway Initiative）是OSGi联盟制定的一个基于Java语言的动态模块化规范，最初是Sun、IBM、爱立信等公司联合发起，目的是使服务提供商通过住宅网关为各种家用智能设备提供各种服务，后来这个规范在Java其他技术领域都有不错的发展，现在已经成为Java世界中“事实上”的模块化标准。OSGi在程序员中最著名的应用案例Eclipse。你对Eclipse进行设置后，不需要重启就可以完成某个功能的开启或关闭，这就是OSGi的功劳。

看了之后，给我的感觉就是这东西非常灵活。OSGi的基本单位是Bundle，每个Bundle都可以有自己的类加载器和父加载器。而Bundle和类也差不多，内部也是package和class组成。但是一个Bundle可以声明它依赖的Java Packeage（通过Import-Package描述），也可以声明它允许导出发布的Java Package（通过Export-Package描述）。在OSGi中，Bundle之间的依赖关系从传统的上层模块依赖叠层模块转变为平级模块之间的依赖，而且类库的可见性得到了非常精确的控制，一个模块里只有被Export过的Package才能被外界访问，其他的Package和class会被隐藏。所以，OSGi才能支持热插拔技术。

而OSGi拥有这么诱人特性的原因就是它的类加载器架构。举一个简单的例子：

Bundle A：声明发布了packageA，依赖了java.*的包
Bundle B：声明依赖了packageA和packageC，同时也依赖了java.*的包
Bundle C：声明发布了packageC，依赖了packageA

那么，三者之间的关系可以用下图表示：

从上图可以看出来，OSGi里面的加载器不再是双亲委派模型的树形结构，而是进一步发展成了一种运行时才能确定的网状结构。更灵活的同时肯定带来了更复杂的使用方法，这点在实际应用中确实值得权衡。

一般来说，在OSGi中，加载一个类可能发生的查找行为和委派关系会比上图复杂的多，大体规则可以总结为：

以java.*开头的类，委派给父类加载器加载
委派列表名单内的类，委派给父类加载器加载
Import列表中的类，委派给Export这个类的Bundle的类加载器加载
查找当前Bundle的CLASSPATH,使用自己的类加载器加载
否则，查找是否在自己的Fragment Bundle中，如果是则委派给Fragment Bundle的类加载器加载
否则，查找Dynamic Import列表的Bundle，委派给对应Bundle的类加载器加载
否则，类查找失败
Understanding the JVM：虚拟机类加载机制
前言

这一章是讲类加载的，前阵子刚刚研究了类加载器的代码实现。但那时候是以代码为主，对JVM内部的工作原理不太清楚，正好趁这个机会巩(xue)固(xi)一下整个JVM的类加载机制。类加载器只是类加载机制7个步骤中的第一步而已，我刚看的时候就搞混了。那么，什么是JVM的类加载机制呢?

虚拟机把描述类的数据从class文件加载到内存中，并对数据进行检验、转换解析和初始化，最终形成可以被虚拟机直接使用的Java类型，这就是虚拟机的类加载机制。

上一章没有细看，知道大体上是讲class文件中每个字节的作用。而.class文件是源代码经过编译后得到的字节码，如果学过编译原理会知道，这个仅仅完成了一半的工作（完成了词法分析、语法分析、语义分析、中间代码生成），接下来就是实际的运行了。而Java选择的是动态链接的方式，即使用到某个类再加载进内存，而不是像C++那样使用静态链接：将所有类加载，不论是否使用到。当然了，孰优孰劣不好判断。静态链接优点在速度，动态链接优点在灵活。

与那些在编译时进行链接的语言不同，Java类型的加载和链接过程都是在运行的时候进行的，这样虽然在类加载的时候稍微增加一些性能开销，但是却能为Java应用程序提供高度的灵活性，Java中天生可以动态扩展的语言特性就是依赖动态加载和动态链接这个特点实现的。

不管怎么说，.class文件要想被执行，需要被JVM加载。而.class文件是如何被JVM处理的呢？这就是本章的重点。

类从加载到虚拟机内存开始，到卸载出内存，一共经历了7个步骤（其中验证、准备、解析三个部分统称为连接（linking））：
1. 加载
2. 验证
3. 准备
4. 解析
5. 初始化
6. 使用
7. 卸载
下图是类的生命周期：

Tips（因为没仔细看下面这段话，让我看后面验证的时候百思不得其解。。真是因小失大）:

上图中，加载、验证、准备、初始化和卸载这个阶段的顺序是确定的，类的加载过程必须按照这种顺序按部就班地开始，而解析阶段则不一定：它在某些情况下可以在初始化阶段之后再开始，这是为了支持Java语言的运行时绑定。这里写的是按部就班地开始，而不是进行或完成。因为这些阶段通常都是交叉混合进行的，通常会在一个阶段执行的过程中调用或激活另外一个阶段。

初始化时间

其中，对于如何加载，Java虚拟机规范并没有说明。但是对于初始化，Java虚拟机规范做了严格的限制，有且只有四种情况必须立即对类进行”初始化”（而加载、验证、准备当然在初始化的前面了）：
1. 遇到new、getstatic、putstatic、invokestatic这四条指令码时，如果类没有进行初始化，必须触发初始化。new肯定是新建对象，而get/putstatic是读取或者设置一个类的静态字段（static final修饰的是编译期放入常量池了，所以不算），invokestatic是调用一个类的静态方法
2. 使用java.lang.reflect包的方法对类进行反射调用的时候，如果类没有进行初始化，必须触发初始化
3. 当初始化一个类时，如果其父类还没有初始化，则触发初始化
4. 当虚拟机启动时，用户需要指定一个要执行的主类（包含main()方法的类），虚拟机会先初始化这个主类
这四种场景中的行为被称为主动引用，除此之外所有引用类的方式都不会触发初始化，称为被动引用。下面有3个例子供大家欣赏= =

例子一：通过子类引用父类的静态属性，不会触发子类的初始化
1. class A {
3. public static int count = 10;
5. static {
6. System.out.println("super class");
7. }
8. }
10. class B extends A {
11. static {
12. System.out.println("sub class");
13. }
14. }
16. public class Example_One {
17. public static void main(String[] args) {
18. System.out.println(B.count);
19. }
20. }/*output:
21. super class
22. 10
23. */
我们会发现，纳尼！！竟然没有输出sub class，很奇怪是吧。原因如下：

对于静态字段，只有直接定义这个字段的类才会初始化，因此通过子类来调用父类的静态字段，只会触发父类的初始化而不会触发子类的初始化。(对父类而言，调用了getstatic，所以触发初始化；对子类而言，new没有吧，get/putstatic没有吧，invokestatic也没有。只是调用了父类的getstatic)而这点会不会触发其他过程（比如加载、验证），Java虚拟机规范并没有说明，取决于具体的虚拟机实现。对于Sun HotSpot来说，可通过-XX:+TraceClassLoading参数看到此操作会导致子类的加载。

例子二：通过数组定义来引用类，不会触发此类的初始化
1. class A {
3. public static int count = 10;
5. static {
6. System.out.println("super class");
7. }
8. }
10. class B extends A {
11. static {
12. System.out.println("sub class");
13. }
14. }
16. public class Example_One {
17. public static void main(String[] args) {
18. B[] bs = new B[10];
19. }
20. }
这段代码执行的时候，没有任何输出，也就是说没有触发初始化。这个其实很简单，bs是神马？bs只是一个数组引用，引用是存在于虚拟机栈的局部变量表中的。因为无法指向数组中元素的地址，所以数组中的元素和引用没有半毛钱关系。当然不会触发初始化了。

但是通过这个例子，有个知识点终于知道原因了：为什么Java语言对数组的访问比C++安全？

如上述例子所示，创建一个10个B元素的数组，并没有触发B的初始化。但是触发了B[]的类的初始化，对于用户代码来说，这并不是一个合法的类。它是虚拟机自动生成的，继承于java.lang.Object类，创建动作由字节码指令newarray触发。这个类代表了一个元素类型为B的一维数组（其实就是一个对象），数组中应有的属性和方法（用户可直接使用的只有修饰为public的length属性和clone()方法）都实现在这个类中。Java语言访问数组比C++安全是因为这个类包装了数组元素的访问方法（本质上来说，数组越界并不是封装在数组元素访问的类中，而是封装在数组访问的xaload/xastore字节码指令中），而C++直接翻译成对数组指针的移动。

例子三：常量在编译阶段会被存入本类的常量池，本质上没有引用定义该常量的类，因此不会触发定义该常量的类的初始化
1. class C {
2. static {
3. System.out.println("const field");
4. }
6. public static final int MAX_INT = 65535;
7. }
9. public class Example_Two {
10. public static void main(String[] args) {
11. System.out.println(C.MAX_INT);
12. }
13. }/*output:
14. 65535
15. */
这个代码想说明的是：常量在编译时期就被放入了调用类的常量池，本质上没有引用到定义常量的类，因此不会触发定义常量的类的初始化。

那么，这是为什么呢？原来Java会在编译的时候将C的MAX_INT的值存储在Example_Two类的常量池中，对A中MAX_INT的引用都被转化为对Example_Two自身常量池的引用。所以，Example_Two中的class文件中并没有C的符号引用的入口，这两个类在编译之后就谁也不认识谁了。仔细一想，这个优化确实有很大的作用。比如一个类 A 引用了一个类 B 的某个常量字段，那么不优化的情况下 A 必须保存 B 的方法区的指针，在将 B 的 class 文件常量池加载到运行时常量池后，A 必须通过指针才能访问。而优化之后，直接存储在自身的常量池中，拿的时候直接从自己兜里拿，高效了很多。

一、类加载的过程

这个是本章的重头戏，主要分为：加载、验证、准备、解析、初始化这几个步骤。下面我们逐个击破。

1. 加载

在加载阶段，虚拟机需要完成3件事情：
- 通过一个类的全限定名来获取定义此类的二进制字节流（从 CLASSPATH 中找到.class 文件，或者从网络上下载的二进制字节流）
- 将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构（保存类的基本信息，名字，实现的接口等），类的引用（不是实例对象的引用）
- 在Java堆中生成一个代表这个类的java.lang.Class对象，作为方法区这些数据的访问入口（生成的这个 Class 对象是该类所有对象的模板。然后该类的所有实例想获取类信息的时候，就通过这个代表该类的唯一的 Class对象来访问方法区的信息）
这里第一点很有意思。结合这一章后面的类加载机制和前面学到的东西，我觉得可以写出来一篇关于类加载器的文章了，敬请期待。而第二点和第三点很好理解，最终.class文件还是要被处理为虚拟机规定的格式的。所以第二点的方法区只是类的静态属性等，前一章讲过了；而Class对象结合上一章，其实就是对象如何引用方法区的类信息，有句柄和直接指针两种实现。Sun的HotSpot是使用的直接指针。

Tips：

加载阶段与连接阶段的部分内容（如一部分字节码格式验证）是交叉进行的，加载阶段尚未完成，连接阶段可能已经开始，但这些夹在加载阶段之中进行的动作，仍然属于连接阶段的内容，这两个阶段的开始时间仍然保持着固定的先后顺序。

2. 验证

前面的加载是要把.class文件中的字节码转换为虚拟机中对应的数据，而由于Java的开放，字节流有五花八门的来源，如果有人写了恶意的代码，那么在执行的时候就会让程序或者JVM崩溃。为了防止这种危险的发生，JVM会在加载的过程中交叉进行验证工作。而验证工作Java虚拟机规范也没有具体的说明（只说不符合.class文件的格式时，抛出java.lang.VerifyError），业界比较统一的做法是这样的：
- 文件格式验证：字节流是否符合.class文件格式规范，能否被当前版本虚拟机处理（比如开头是CAFEBABE）。该阶段的主要目的是保证输入的字节流能正确地解析并保存于方法区之内，格式上符合描述一个Java类型信息的要求。经过这个阶段的验证之后，字节流才会进入内存的方法区进行存储，后面三个验证阶段都是基于方法区的存储结构进行验证的
- 元数据验证：对字节码描述的信息进行语义分析，说白了就是语法检查。比如我implements某个接口，是不是把所有函数都实现了、是否继承了final类呀。
- 字节码验证：最复杂的验证过程，进行数据流和控制流分析。元数据验证是对类的方法体进行语义检查，而字节码验证是保证被校验类的方法在运行时不会危害虚拟机。比如跳转指令不会跳转到方法体外的字节码指令上；类型转换是正确的；如果一个类方法体的字节码没有通过字节码验证肯定是有问题的，但是通过了也不能说明类方法体没有问题。这个是NP问题
- 符号引用验证：将符号引用转化为直接引用，将在连接阶段的第三个过程——解析阶段进行。符号引用验证可以看做是对类本身以外（常量池中的各种符号引用）的信息进行匹配性的验证。符号引用的目的就是确保解析动作能正常执行，所以这个阶段验证比如：验证符号引用中通过字符串全限定名能否找到对应的类。
3. 准备

准备阶段是在方法区为类的静态属性分配内存，并设置初始值。这时候进行内存分配的只有类变量而不包括类的实例变量，因为实例变量将在对象实例化的时候随着对象一起分配到Java堆上。仔细想想道理很简单啊，因为方法的东西是该类所有对象共享的，所以只保存一份即可。而对象的实例肯定是各自持有，所以在堆上分配对象的时候再把实例变量分配一下。

这里的初始值通常情况是数据的零值。比如：
1. public static int value = 123;
那么value在准备阶段的初始值为0，而不是123。因为这时候尚未开始执行任何Java方法，而把value赋值为123的putstatic指令是程序被编译后，存放于类构造器()方法中，所以把value赋值123的动作将在初始化阶段才会执行。上面说的通常情况，也有一些特殊情况：如果某些static字段是final修饰的，那么value会在编译时被javac生成ConstantValue属性，那么在准备阶段就会初始化为123。（所以static final不是编译期被赋值的，而是仅仅标记为ConstantValue属性，准备阶段才初始化对应的值）
1. public static final int value = 123;
这时候，在准备阶段value的值就是123了（归功于编译时候的ConstantValue属性哦）

4. 解析

解析阶段是虚拟机将常量池内的符号引用替换为直接引用的过程。这两个概念要分清：
- 符号引用：以一组符号来描述所引用的目标，符号引用可以是任意值，只要能定位目标。符号引用与虚拟机的内存布局无关，而且目标不一定加载到内存中
- 直接引用：直接指向目标的指针、相对偏移量或者是一个能间接定位到目标的句柄。直接引用是与虚拟机的内存布局有关的。所以同一个符号引用在不同的虚拟机中直接引用一般是不同的（因为可以有各自的内存布局）。如果有了直接引用，那么目标一定在内存中
理解符号引用比较关键，首先符号引用是编译原理的概念，包括了下面3种常量：
- 类和接口的全限定名
- 字段的名称和描述符
- 方法的名称和描述符
不难看出，符号引用其实就是用来定向外部数据的，因为在.class文件中不会保存各个方法和字段的最终内存布局信息，因此这些字段和方法的符号引用不经过转换的话是无法被虚拟机使用的。正确的流程应该是当虚拟机运行时，需要从常量池获得对应的符号引用，再在类创建或运行时解析并翻译到具体的内存地址中。

所以，符号引用相当于在类内部使用的，虚拟机相当于外部环境。举个例子，你爸叫“赵百万”，在家里你可以直接叫爸，但是出门跟别人介绍就需要告诉别人“赵百万”了，你要是告诉这是你爸，估计就要挨揍了：）而这个“赵百万”就可以理解为直接引用。

5. 初始化

是类加载阶段的最后一步，前面的类加载过程中，除了在加载阶段用户应用程序可以定义自己的类加载器参与，后面的验证、准备、解析都是虚拟机主导的，用户无法干预。到了初始化阶段，才真正执行类中定义的Java程序代码（本质上来说就是解释器执行字节码了）。

在准备阶段会对方法区内的属性进行一次“初始化”，而对于final修饰的则是在编译的时候加入ConstatnValue属性。而初始化阶段是根据程序员为程序制定的主观计划去初始化类变量和其他资源，或者可以说：执行类构造器()方法的过程。
- ()方法是由编译器自动收集类中的所有类变量的赋值动作和静态语句块(static{})中的语句合并产生的，而顺序是按照在类中定义的顺序
- ()方法与类的构造函数不同，它不需要显式调用父类构造器，虚拟机会保证在子类的()执行前，父类的()会执行完。因此，虚拟机第一个被运行的()一定是java.lang.Object的
- 由于父类的()方法先执行，就意味着父类的静态语句块要优于子类的变量赋值操作，下面有个例子哦
- 接口不一定有()方法，因为按接口的由来原理（通用协议），接口是没有属性的，在枚举以前可以用接口来完成常量的定义，但是有了枚举，还是使用枚举比较好
- 若接口有变量初始化的赋值操作，这时候的()不需要先执行父类的()方法。只有用到父接口定义的变量时才会触发父类的()方法。同理，接口的实现类在执行()方法前也不需要执行接口的()方法
- 虚拟机会保证一个类的()方法在多线程环境中被正确的加锁和同步。如果多个线程同时初始化一个类，那么只会有一个线程执行类的()方法，其他线程会被阻塞等待，直到()完成。
二、类加载器

四个方面：
1. 类加载器由来：介绍类加载器产生的历史背景
2. 类加载器基本概念：重点剖析java.lang.ClassLoader的loadClass()方法
3. 开发自己的类加载器：做一个demo
1. 类加载器由来

类加载器从 JDK 1.0 就出现了，最初是为了满足 Java Applet 的需要而开发出来的。很奇葩的是现在 Java Applet 被淘汰了，但类加载器却在类层次划分、OSGi、热部署、代码加密等领域大放异彩，成为了Java的一大王牌，可谓失之东隅，收之桑榆。

因为Java的广告就是一次编写到处运行，所以Sun将Java语言和JVM当成两个产品来开发。而JVM对应的《Java虚拟机规范》就是为了实现多输入，统一处理的目的：

Java虚拟机规范，把类加载机制中的“通过一个类的全限定名来获取描述此类的二进制字节流”这个动作放在JVM的外部，只要外部应用程序处理后的输入符合JVM的规定（比如Java自家的.class文件字节流），那么就可以被JVM处理成平台相关的机器码，从而实现应用程序级别的跨平台。而这个模块就被称为类加载器。

用一幅图来说明：

2. 类加载器基本概念

首先必须重点强调的是：

对于Java中的任意一个类，都需要由加载它的类加载器和这个类本身一同确立其在JVM中的唯一性，(定位一个类，需要类加载器 + 类本身)。所以，看两个类是否相等（Class对象的equals()方法等），前提就是由一个类加载器加载的。如果不是一个类加载器加载的，即使是同一个.class文件也肯定是不相等的。理解这点是开发自己的类加载器的大前提。

2.1. 类加载器是怎样工作的？

顾名思义，类加载器就是就是用来把Java文件加载到JVM中运行的。Java程序运行的大概过程是：
1. 编写Java源代码程序
2. Java编译器编译成.class文件
3. 类加载器将.class文件加载进JVM，转换成java.lang.Class的一个实例，每个这样的实例代表一个Java类。通过这个实例的newInstance()方法可以创建出该类的一个对象
基本上所有的类加载器都是java.lang.ClassLoader的实例，所以我们需要重点学习这个类。当然，学习方法很简单，直接去看源码。逻辑清晰，很容易的。最重要的是loadClass()方法，我把这个函数的代码粘出来：
1. protected Class loadClass(String name, boolean resolve)
2. throws ClassNotFoundException
3. {
4. synchronized (getClassLoadingLock(name)) {
5. // First, check if the class has already been loaded
6. Class c = findLoadedClass(name);
7. if (c == null) {
8. long t0 = System.nanoTime();
9. try {
10. if (parent != null) {
11. c = parent.loadClass(name, false);
12. } else {
13. c = findBootstrapClassOrNull(name);
14. }
15. } catch (ClassNotFoundException e) {
16. // ClassNotFoundException thrown if class not found
17. // from the non-null parent class loader
18. }
20. if (c == null) {
21. // If still not found, then invoke findClass in order
22. // to find the class.
23. long t1 = System.nanoTime();
24. c = findClass(name);
26. // this is the defining class loader; record the stats
27. sun.misc.PerfCounter.getParentDelegationTime().addTime(t1 - t0);
28. sun.misc.PerfCounter.getFindClassTime().addElapsedTimeFrom(t1);
29. sun.misc.PerfCounter.getFindClasses().increment();
30. }
31. }
32. if (resolve) {
33. resolveClass(c);
34. }
35. return c;
36. }
37. }
上面代码注释已经非常清楚，关于类加载器的工作，大体上有3步：
1. 检查这个类是否已经被加载过
2. 如果没有被加载过，调用父类加载器去加载
3. 如果父类加载器加载失败，就调用当前类加载器去加载
这里面有个地方值得我们思考：为什么要调用父类加载器先加载呢？如果已经被加载过，我直接使用缓存就好了，如果没有，我自己去加载就可以了嘛。这多出来的一步是干嘛的？下面就来说一说Java的双亲委派模型

2.2. 双亲委派模型

Java 中的类加载器大致可以分成两类：
- 一类是系统提供的引导类加载器，它是用C++语言实现的，是JVM自身的一部分；
- 另外一类则是其他所有的类加载器，这些类加载器都是用Java语言实现的，独立于虚拟机的外部，并且全部继承自java.lang.ClassLoader：
详细介绍一下：
- 引导类加载器（bootstrap class loader）：它用来加载 Java 的核心库，是用C++实现的，负责将${JAVA_HOME}/lib目录下的，或者-Xbootclasspath参数所指定的路径中的，并且是Java虚拟机识别的（仅按照文件名识别，如rt.jar,不符合的类库即使放在lib下也不会被加载）类库加载到JVM内存中，引导类加载器无法被Java程序直接引用
- 扩展类加载器（extensions class loader）：它用来加载 Java 的扩展库，${JAVA_HOME}/ext下面的，或者被java.ext.dirs系统变量所指定的路径中的所有类库，开发者可用
- 系统类加载器（system class loader）：它根据 Java 应用的类路径（CLASSPATH）来加载 Java 类。一般来说，Java 应用的类都是由它来完成加载的。可以通过 ClassLoader.getSystemClassLoader()来获取它。
除了系统提供的类加载器以外，开发人员可以通过继承 java.lang.ClassLoader类的方式实现自己的类加载器，以满足一些特殊的需求。

除了引导类加载器之外，所有的类加载器都有一个父类加载器。通过ClassLoader.getParent()方法可以得到。对于系统提供的类加载器来说，系统类加载器的父类加载器是扩展类加载器，而扩展类加载器的父类加载器是引导类加载器；对于开发人员编写的类加载器来说，其父类加载器是加载此类加载器 Java 类的类加载器。因为类加载器 Java 类如同其它的 Java 类一样，也是要由类加载器来加载的。一般来说，开发人员编写的类加载器的父类加载器是系统类加载器。类加载器通过这种方式组织起来，形成树状结构。树的根节点就是引导类加载器。下面给出类加载器树状组织结构示意图，其中的箭头指向的是父类加载器。

Tips:

如图所示，类加载器之间的关系不是继承，而是使用组合来复用父加载器的代码

双亲委派模型的工作过程是：如果一个类加载器收到了类加载的请求，那么它首先会把这个请求委派给父加载器完成，以此类推。因此所有的类加载请求最终都应该传送到顶层的引导类加载器中，只有当父加载器无法完成这个加载请求，子加载器才会尝试自己去加载。那么，回到上面的问题。为什么要使用这种代理机制呢？

这样做Java类和它的类加载器就一起具备了带有优先级的层次关系。例如类java.lang.Object,它存放在rt.jar中，无论哪一个类加载这个类，最终都会被委派到引导类加载器去完成它的加载，因此Object类在程序中的各种类加载器环境中都是一个类。这样做也保证安全性，因为如果有人想恶意置入代码，类加载器的代码就避免了这种情况的发生。

2.3. 破坏双亲委派模型

上文提到的双亲委派模型并不是一个强制性的约束模型，而是推荐使用。但在某些特殊情况下，双亲委派也被破坏过：
- JDK 1.2发布之前：压根就没双亲委派模型，但是classloader在JDK 1.0就存在了。所以引入双亲委派模型也做一点妥协，具体的不用关心。反正现在出现的概率为0了
- 自身缺陷：用户调用基础类的时候，就会被上层类加载器加载。但如果基础类要调用用户代码呢？比如JNDI（Java Naming Directory Interface）,为此虚拟机团队设计了一个无奈之举：线程上下文类加载器。具体的可以自己google。包括最常用的JDBC也是使用线程上下文类加载器。
- 动态替换：也就是所谓的热部署，典型就是OSGi了。
其实第二点的JNDI和第三点的OSGi都是比较常用的功能，如果想把类加载器学好，一定要去看看OSGi哦。

3. 开发自己的类加载器

接下来我们就自己动手写一个简单的类加载器。
1. public class FileSystemClassLoader extends ClassLoader {
3. private String rootDir;
5. public FileSystemClassLoader(String rootDir) {
6. this.rootDir = rootDir;
7. }
9. /*
10. * 对用户类加载器而言，一般重写findClass方法即可。loadClass不要重写，因为可能会破坏双亲
11. * 委派模型，造成系统核心类库加载错误
12. */
13. protected Class findClass(String name) throws ClassNotFoundException {
14. byte[] classData = getClassData(name);
15. if (classData == null) {
16. throw new ClassNotFoundException();
17. }
18. else {
19. return defineClass(name, classData, 0, classData.length);
20. }
21. }
23. //这里用户可以自定义.class文件的来源（比如从网络下载后需要解密才能被JVM加载）
24. private byte[] getClassData(String className) {
25. String path = classNameToPath(className);
26. try {
27. InputStream ins = new FileInputStream(path);
28. ByteArrayOutputStream baos = new ByteArrayOutputStream();
29. int bufferSize = 4096;
30. byte[] buffer = new byte[bufferSize];
31. int bytesNumRead = 0;
32. while ((bytesNumRead = ins.read(buffer)) != -1) {
33. baos.write(buffer, 0, bytesNumRead);
34. }
35. return baos.toByteArray();
36. } catch (IOException e) {
37. e.printStackTrace();
38. }
39. return null;
40. }
42. private String classNameToPath(String className) {
43. return rootDir + File.separatorChar
44. + className.replace('.', File.separatorChar) + ".class";
45. }
46. }
上面只是一个简单的例子，但是核心已经说明白了：

重写findClass()方法，只要保证JVM要加载的.class文件符合Java虚拟机规范的规定，那么无论.class文件是怎样的来的，对JVM全都是透明的。而这就为用户提供了极大的灵活性。

三、小结

几个常见问题：
1. JVM 类加载过程：
  - 加载、连接（验证、准备、解析）、初始化、使用、卸载
  - Class 初始化的触发条件：
    - Class 自身的操作：
      - new 新建对象
      - get static、put static：调用或设置静态字段
        
        只有直接定义这个字段的类，才会初始化；
        
        常量存放在常量池中，不会触发 Class 的初始化；
      - invoke static：静态方法
    - reflect 反射方式调用类时
    - 初始化子类时，父类如果没有初始化，就进行初始化
  - Class 初始化，只会初始化一次，因此 static 代码块，只会执行一次
2. 如何判断 2 个 Class 是否相等？同一个 ClassLoader，并且，同一个全限定名的Class；
3. 类加载过程：双亲委派模式，3 个步骤：
  1. 检查这个类是否已经被加载过
  2. 如果没有被加载过，调用父类加载器去加载
  3. 如果父类加载器加载失败，就调用当前类加载器去加载
4. 常见的类加载器：类加载器之间，不是继承关系，而是组合关系，调用父加载器的代码。
  1. 引导类加载器（Bootstrap ClassLoader）：lib 目录，rt.jar
  2. 扩展类加载器（Extension ClassLoader）：ext 目录
  3. 系统类加载器（System ClassLoader）：通常使用的类加载器
  4. 应用类加载器（App ClassLoader）：用户自己实现的类加载器
5. 为什么使用双亲委派模式？
  1. 保证类一致性：Java 中 equals 方法的使用、类中静态变量的使用等
  2. 安全性：避免因为用户重写某个 Class，导致恶意代码植入
6. 破坏双亲委派模式：
  1. 双亲委派模式弊端：用户调用基础类的时候，就会被上层类加载器加载。但如果基础类要调用用户代码呢？
  2. 解决办法：线程上下文类加载器，JDBC、热部署（OSGi）

posted @ 2021-12-11 22:25 CharyGao 阅读(20) 评论(0) 收藏举报

刷新页面返回顶部

硅基文明

代码改变不了世界，但是改变世界需要代码。

Understanding the JVM：类加载及执行子系统的案例与实战

前言

一、类加载器实例之——Tomcat

1. Tomcat目录结构

2. Tomcat版本升级

二、OSGi：灵活的类加载器结构

Understanding the JVM：虚拟机类加载机制

前言

初始化时间

一、类加载的过程

1. 加载

2. 验证

3. 准备

4. 解析

5. 初始化

二、类加载器

1. 类加载器由来

2. 类加载器基本概念

2.1. 类加载器是怎样工作的？

2.2. 双亲委派模型

2.3. 破坏双亲委派模型

3. 开发自己的类加载器

三、小结