类的加载、连接与初始化过程的详细分析
一、类加载阶段
1.类加载方式
类的加载指的是将类的.class文件的二进制数据读入内存中,将其放在运行时数据区的方法区内。然后在堆区创建一个Java.lang.Class对象,
用来封装类在方法区内的数据结构,该对象是由JVM在加载类时创建的。所以每个类都会对应一个Class类型的对象,通过getClass()来获取,
并且无论生成该类的多个少对象,其Class类型的对象只有一个。Class类的构造方法是私有的,并且Class类的对象只有JVM才能创建,创建时机为加载.class文件时。
因此Class类是整个反射的入口,因为每个类都会在内存中对应一个描述它的Class类型的对象,使用这个对象就可以获取到目标类所关联的class文件中的数据结构。
类的加载有以下几种方式(加载.class文件的方式)
Ø 从本地文件系统直接加载
Ø 通过网络下载.class文件(java.NET.URLClassLoader)
Ø 从zip、jar等归档文件中加载 .class文件
Ø 从专有的数据库中提取 .class文件
Ø 将Java源文件动态编译为.class文件
类加载的最终产物就是位于堆区中的Class对象(注意此时并没有被加载类的对象存在,刚刚加载类)。Class对象封装了类在方法区中的数据结构,
并且向Java程序员提供了访问方法区内的数据结构的接口,这些接口就是Java反射的相关类和方法。
1. 类加载器
有两种类型的类加载器
(1).Java虚拟机自带的类加载器,其中包括以下三种类加载器
Ø 根类加载器(Bootstrap ClassLoader)
Ø 扩展类加载器(Extension ClassLoader)
Ø 系统类加载器(System ClassLoader),又称为应用类加载器
其中第一种类加载器是JVM最底层的类加载器,由C++编写,因此我们无法访问到根类加载器。后面两种其实是基于第一种的,由Java语言实现的类加载器。
(2).用户自定义的类加载器,可以定义加载的方式,加载时机以及加载过程中做一些事情。
使用java.lang.ClassLoader的子类,通过ClassLoader来实现自定义的类加载器,这个过程中可以定义类的加载方式,加载时机以及加载过程中做一些事情。
通过给定ClassLoader一个类的名称,它会将其作为一个文件名称试图去读取该文件内容并根据内容组装一个类的描述。每个类对象其实都包含了一个对定义它的
那个ClassLoader的一个引用,因为任何类都是由类加载器加载的,因此通过该类就可以访问到对应的类加载器。
通过类对象的getClass().getClassLoader()或类的class属性的getClassLoader()就可以获取到类所对应的类加载器,也就是加载该类的哪个类加载器。
getClassLoader()可能返回一个null,那么就代表该类的类加载器是根类加载器(Bootstrap ClassLoader);换句话说,如果一个类是有根类加载器加载的,
那么就无法获取到该类加载器,此时getClassLoader()返回null,因为根类加载器是使用C++编写的,我们无法在程序中访问它。例如String等类就是由根类
加载器加载的,因此String.class.getClassLoader()将返回null。
对于JDK内置的类一般都是由根类加载器加载的,因此通过它们调用getClassLoader()返回null;自定义的类一般通过
sun.misc.Launcher$AppClassLoader加载,通过输出getClassLoader()结果即可看到。
对于JDK动态代理的InvocationHandler类的invoke方法,第一个参数是一个ClassLoader类型,就是用于动态的加载第二个参数所传递的类,
然后会根据所加载的类动态的创建出所加载类的对象,然后根据该对象创建出一个该对象的代理对象。
3.类加载时机
类加载器并不需要等到某个类被主动使用时才加载它。这与类的初始化不同,上面说过JVM必须在每个类或接口被Java程序首次主动使用时才初始化它们,
注意加载与初始化的却别!
JVM规范允许类加载器在预料到某个类将要被使用时就预先加载它,如果在预先加载的过程中遇到了.class文件不存在或有错误,此时并不会报错,
而是类加载器必须等到在程序首次使用该类时才报告错误,这种错误类型为LinkageError。因此如果这个类加载后一直没有被主动使用,
那么类加载器就一直不会报告错误。
二、类连接阶段
1.类的验证
类验证除了包装类的可用,还为了包装安全性,防止构件出自定义的类来侵入系统。
类验证所要完成的功能:
Ø 类文件结构的检查
确保类文件遵从Java类文件的固定格式
Ø 语义检查
确保类本身符合Java语言的语法规定,比如验证final类型的类有无子类,以及final类型的方法是否被覆盖或重写。
Ø 字节码验证
确保字节码流可以被Java虚拟机安全地执行。字节码流代表Java方法(包括静态和实例方法),它是由被称作操作码的单字节指令组成的序列,
每个操作码后都跟着一个或多个操作数。字节码验证步骤会检查每个操作码是否合法,即是否有着合法的操作数。
Ø 二进制兼容性的验证
确保相互引用的类之间协调一致。例如在Worker类的gotoWork()方法中会调用Car类的run()方法,此Java虚拟机验证验证Worker类的时候会
检查方法区内是否存在Car类的run()方法,如果不存(当Worker类和Car类的版本不兼容就会出现该这个问题,例如低版本JRE编译class的到高版本JRE中运行)
在就会抛出NoSuchMethodError错误。
2. 类连接之准备阶段
在准备阶段,Java虚拟机为类的静态变量分配内存空间并设置默认的初始值,注意不是程序中=赋值的哪个值,而是Java对象变量的默认值。
例如,对于以下的Simple类,在准备阶段为int类型的静态变量a分配4个字节的内存空间,并赋予默认值0;为long类型的变量b分配8个字节的内存空间,并赋予默认值0。
public class Simple {
private static int a=1;
private static long b;
static { b=2;}
}
3.类连接之解析阶段
在解析阶段,Java虚拟机会把类的二进制数据中的符号引用替换为直接引用。例如Worker类中gotoWork()方法中会引用Car类的run()方法:
public void gotoWork(){
car.run(); //这段代码在Worker类的二进制数据中表示为符号引用
}
在Worker类的二进制数据中,包含了一个对Car类的run()方法的符号引用,它由run()方法的全名和相关描述符组成。在解析阶段,Java虚拟机会
把这个符号引用替换为一个指针,该指针指向Car类的run()方法在方法区内的内存位置,这个指针就是直接引用。
类被加载后就进入了连接阶段。连接就是将已经读入到内存的类的二进制数据合并到虚拟机的运行时环境中。所谓的数据合并,因为编译后的每个class文件
在硬盘中都是独立的,但是每个class之间可能存在引用关系以及方法之间存在调用关系,此时就需要根据它们之间的关系将这些class数据合并在一起放入运行时环境中。
三、类初始化阶段
1.类的初始化时机
类连接阶段的解析步骤完成后就进入了类的初始化阶段,并且只有主动使用类时才会执行初始化。在初始化阶段,Java虚拟机执行类的初始化语句,
为类的静态变量赋予初始值(程序中使用赋值语句所赋予的值)。
在程序中,静态变量的初始化有两种途径:
> 在静态变量的声明处进行初始化
> 在静态代码块中进行初始化,静态代码块也是在类加载后的这个初始化阶段被执行的。
例如下面的代码中,变量a、b被显式初始化,而变量c没有显式初始化,其保持默认值0
public class Sample {
private static int a=1; //声明时初始化静态变量
private static int b;
private static int c;
static {
b=2; //在静态代码块中初始化静态变量
}
}
2.类的初始化步骤:
(1) 如果类没有被加载和连接,那么就先执行加载和连接过程
(2) 如果类存在父类并且父类没有被初始化,那么就先初始化父类,一直初始化类继承结构到Object
(3) 如果类存在初始化语句,例如赋值语句或静态代码块,那么就执行这些初始化语句。
3.接口的初始化时机:
当JVM初始化一个类时,要求它的所有父类都已经被初始化,但是这个规则不适用于接口。
(1) 在初始化一个类时,并不会先初始化它所实现的接口;
(2) 初始化一个接口时,并不会先初始化它所继承的父接口
因此,一个父接口并不会因为它的子接口或实现类的初始化而被初始化。只有当程序首次使用特定接口的静态变量时,才会导致该接口的初始化。
只有当程序访问的静态变量或静态方法确实在当前类或接口中定义时,才会认为是对类或接口的主动使用。
调用ClassLoader的loadClass方法加载一个类,并不设置对类主动使用的六种情况,因此也不会初始化。
原文地址:http://blog.csdn.net/sunfeizhi/article/details/50421581

浙公网安备 33010602011771号