Java虚拟机(三)——类加载子系统概述

类加载子系统

本文只简单描述加载类的过程,并不探讨某些过程的细节。

虚拟机执行流程

在这里插入图片描述

  • 如果想自己手写一个Java虚拟机的话,主要考虑哪些结构呢?
    • 类加载器
    • 执行引擎

类加载子系统作用

类加载子系统

  • 负责从文件系统或网络中加载Class文件,class文件在开头有特定的标识(即CA FE BA BE字节码开头)
  • ClassLoader只负责Class文件的加载,至于是否可以运行,由Execution Engine决定。
  • 加载的类信息存放在方法区中。除了类的信息外,方法区中还会存放运行时的常量池信息,可能还包括字符串字面量和数字常量(这部分常量信息是Class文件中常量池部分的内存映射)

类加载器角色

  • ClassFile存在本地硬盘上,最终将要加载到JVM中来,根据文件实例化N个一模一样的实例
  • ClassFile加载到JVM中,被称为DNA元数据模板,放在方法区
  • 在.class文件->JVM ->元数据模板,此过程需要类装载器

类加载过程

1. 加载(Loading)

  1. 通过类的全限定名获取定义此类的二进制字节流
  2. 将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构
  3. 在内存中生成一个代表这个类的java.lang.Class对象。作为方法区中这个类的各种数据的访问接口

类的全限定名其实就是类的绝对路径,如:Date类的全限定类名就是 java.util.Date

方法区在JDK7以前是永久代(PermGen),JDK8开始,为元空间。附录为永久带与元空间(MetaSpace)区别

加载.Class文件的方式

  • 本地系统中直接加载
  • 网络获取,如:Web Applet
  • 从zip压缩包中读取,成为日后jar、war的基础
  • 运行时计算生成,使用最多的是动态代理技术
  • 由其它文件生成,如:JSP应用
  • 从专有数据库中提取.Class文件,较为少见
  • 从加密文件中获取,有防Class文件被反编译的保护措施

2. 链接(Linking)

验证(verify)

  • 目的在于确保Class文件的字节流中包含信息符合当前虚拟机要求,保证被加载的正确性,不会危害虚拟机自身安全
  • 主要包括 文件格式验证、元数据验证、字节码验证、符号引用验证四种验证

准备(Prepare)

  • 为类变量分配内存并设置该类变量的默认初始值,即零值
  • 这里不包含用final修饰的static,因为final在编译的时候就会分配,准备阶段会对其进显式初始化
  • 不会为实例变量分配初始化,类变量会分配在方法区中,实例变量是会随着对象一起分配到Java堆中

解析(Resolve)

  • 将常量池内的符号引用转换为直接引用的过程
  • 事实上,解析操作往往会伴随着JVM在执行初始化之后再执行
  • 符号引用就是一组符号来描述所引用的目标,符号引用的字面量形式明确定义在《Java虚拟机规范》中的Class文件格式中,直接引用就是直接指向目标的指针、相对偏移量或一个间接定位到目标的句柄
  • 解析动作主要针对类或者接口、字段、类方法、接口方法、方法类型等,应对常量池中的CONSTANT_Class_infoCONSTAN_Fieldref_infoCONSTANT_Methodref_info

初始化(Initialization)

  • 初始化阶段就是执行类构造器方法<clinit>()的过程
  • 此方法不需要定义,是javac编译器自动收集类中的所有类变量的赋值动作和静态代码块中的语句合并而来,若不需要合并,则字节码文件中不存在<clinit>()方法
  • 构造器方法中指令按照语句在源文件中出现的顺序执行
  • <clinit>()不同于类的构造器
    • 构造器是虚拟机视角下的<init>()
  • 若该类具有父类,JVM会保证子类的<clinit>()执行前,父类的<clinit>()已经执行完毕
  • 虚拟机必须保证一个类的<clinit>()方法在多线程下被同步加锁,也就是说,<clinit>()只会被执行一次
public class ClassInitTest{
	private static num =1;
    static{
		num =2;
        number = 20;
        System.out.println(num);//正常
        System.out.println(number);//非法的前向引用
    }
    private static int number = 10;

}

public class ClassInit{
	private static int  num =1;
	static{
		num =2;
		number =20;
	}
	private static int number = 10;
	public static void main(String [] args){
		System.out.println(ClassInitTest.num);//2
        System.out.println(ClassInitTest.number);//10
	}
}

上面这个程序中,number的值由如下变化:

  1. 在连接的prepare步骤中,将其初始化为0
  2. 在initial步骤中,将其赋值为20
  3. 然后将其赋值为10
public class ClinitTest{
    private int a =1;
    public static void main(String[]args){
        int b =2;
    }
}

类加载器的分类

严格来讲分为两类(Java虚拟机规范),引导类加载器(bootstrap class loader)和自定义类加载器(User-Defined ClassLoader)

从概念上来讲,自定义类加载器一般指的是程序中由开发人员自定义的一类加载器,但是Java虚拟机规范却没有这么定义,而是将 所有派生于抽象类ClassLoader的类加载器都划分为自定义类加载器

无论类加载器如何分,最常见的类加载器始终只有3个:

  • 引导类加载器(bootstrap class loader)----> C/C++ 实现的

  • 扩展类加载器(Extension Class Loader)—Java实现

  • 系统类加载器(System ClassLoader)—Java实现

后两者都属于用户自定义类加载器,这四者(bootstrap Class LoaderExtension Class LoaderSystem Class LoaderUser Defined Class Loader)是包含被包含关系,并非上层下层、继承的关系

public class ClassLoaderTest{
    public static void main(String [] args){
        //获取系统类加载器
        ClassLoader systemClassLoader = ClassLoader.getSystemClassLoader();
        System.out.println(systemClassLoader); //sun.misc.Launcher$AppClassLoader@18b4aac2
        //获取其上层,扩展类加载器
        ClassLoader extClassLoader= systemClassLoader.getParent();
        System.out.println(extClassLoader); //sun.misc.Launcher$ExtClassLoader@1b6d3586
        //获取上层引导类加载器
            ClassLoader bootstrapClassLoader = extClassLoader.getParent();//获取不到,为null
        System.out.println(bootstrapClassLoader);

        //对用户自定义类来说,默认使用系统类加载器进行加载
        System.out.println(ClassLoaderTest.class.getClassLoader()); //sun.misc.Launcher$AppClassLoader@18b4aac2
        //String由引导类加载器加载--->Java核心类库由引导类加载器加载
        System.out.println(String.class.getClassLoader()); //null

    }
}

引导类加载器(启动类加载器)

  • 由C/C++ 实现,嵌套在JVM内部
  • 用来加载Java的核心类库:JAVAHOME/jre/lib/rt.jarresources.jarsun.boot.class.path路径下的内容
  • 用于提供JVM自身需要的类
  • 并不集成自java.lang.ClassLoader,没有父加载器
  • 加载扩展类和应用程序类加载器,并指定为他们的父类加载器
  • 出于安全考虑,BootStrap启动类加载器只加载包名包含java、javax、sun等开头的类

应用程序类加载器(AppClassLoader)

  • Java语言编写,由sun.misc.Launcher$AppClassLoader实现
  • 派生于ClassLoader类
  • 父加载器为扩展类加载器
  • 负责加载环境变量Classpath或系统属性 java.class.path指定路径下的类库
  • ** 是程序中默认的类加载器**,java的程序一般都是由它来进行加载
  • 通过ClassLoader.getSystemClassLoader()方法可以获取该类加载器

扩展类加载器

  • Java语言编写,由sun.misc.Launcher$ExtClassLoader实现

  • 派生于ClassLoader类

  • 父类加载器为启动类加载器(由启动类加载器加载的,并非是类的继承关系,而是包含关系)

  • java.ext.dirs系统属性所制定的目录中加载类库,或从JDK的安装目录的jre/lib/ext子目录(扩展目录)下加载类库。 如果用户创建的JAR在此目录下,也会自动由扩展类加载器加载

  • 通过ClassLoader.getSystemClassLoader()方法可以获取该类加载器

用户自定义类加载器概述

为什么要自定义类加载器?

  • 隔离加载类(防止不同框架类路径冲突等)
  • 修改类加载的方式
  • 扩展加载源
  • 防止源码泄露

实现步骤:

  1. 通过继承抽象类java.lang.ClassLoader类的方式,实现自己的类加载器
  2. 在JDK1.2之前,在自定义类加载器时,总会去继承ClassLoader类并重写loadClass()方法,从而实现自定义的类加载类,但是在JDK1.2之后已经不再建议用户去覆盖loadClass方法,而是建议把自定义的类加载逻辑写在findClass()方法中
  3. 在编写自定义类加载器时,如果没有太过复杂的需求,可以直接继承URLClassLoader类,这样可以避免自己去编写findClass()方法以及获取字节码流的方式,使得自定义类加载器编写更加简洁

关于ClassLoader

  • 是一个抽象类,除了启动类加载器,所有类加载器都派生自它

获取classloader的途径

  • 获取当前类的ClassLoader:clazz.getClassLaoder
  • 获取当前线程上下文的ClassLoader:ClassLoader.getSystemClassLoader
  • 获取系统的ClassLoader:ClassLoader.getSystemClassLoader
  • 获取调用者的ClassLoader:DriverManager.getCallerClassLoader

双亲委派机制

Java虚拟机对class文件采用 按需加载的方式,也就是说当需要使用该类时才会将class文件加载到内存生成class对象。而且加载某个类的class文件时,Java虚拟机采用的是 双亲委派机制 即把请求交由父类处理,它是一种任务委派机制。

工作原理

  • 如果一个类加载器收到了类加载请求,它并不会自己先去加载,而是把这个请求委托给父类的加载器去执行
  • 如果父类加载器还存在其父类,则进一步向上委托,依次递归,请求最终将达到顶层的启动类加载器
  • 如果父类加载器可以完成类加载任务(是该加载器的加载范围),就成功返回,不再使用下层加载器加载;倘若父类加载器无法完成此加载任务,子加载器才会尝试自己去加载,这就是双亲委派模型。

(引导类加载器--------->扩展类加载器------------> 系统类加载器)

优势

  • 避免类的重复加载
  • 保护程序安全,防止核心API被随意篡改
    • 自定义类:java.lang.String----找不到main方法,不会从这里获取String
    • 自定义类:Java.lang.testAPI—安全问题,阻止包名定义
    • 以上运行均报错

打破双亲委派机制的方法

  1. 自定义类加载器,重写loadClass方法;

  2. 使用线程上下文类加载器;

沙箱安全机制

public class String {
    static {
        System.out.println("this is String ");
    }

    public static void main(String [] args){
        System.out.println("String.main()");
    }
}

自定义String类,在加载定义String类的时候回率先使用引导类加载器,而引导类加载器在加载的过程中会先加载jdk自带的文件(rt.jar包中的java/lang/String.class)报错信息说没有main方法,就是因为加载的是rt.jar中的String类。这样可以保证对java核心源码的保护,这就是沙箱安全机制

判断class对象是否为同一个类的两个必要条件

  • 类的完整类名必须一致(包括包名)
  • 加载这个类的ClassLoader(指ClassLoader实例对象)必须相同

也就是说,即使两个类来源同一个Class文件,但是只要加载的ClassLoader实例对象不同,那么这两个类对象就是不等的

JVM必须知道由启动还是用户类加载器加载

  • 如果一个类型是由用户类加载器加载的,那么JVM会 将这个类加载器的一个引用作为类型信息的一部分保存在方法区中。当解析一个类型到另一个类型的引用的时候,JVM需要保证这两个类型的类加载器是相同的。

Java程序对类的使用方式

分为主动使用和被动使用

  • 主动使用有七种情况:
    • 创建类的实例
    • 访问某个类或者接口的静态变量
    • 调用类的静态方法
    • 反射
    • 初始化一个类的子类
    • Java虚拟机启动时被标明为启动类的类
    • JDK7开始提供的动态语言支持:java.lang.invoke.MethodHandle实例的接卸结果 REF_getStaticREF_pubStaticREF_invokeStatic句柄对应的类没有初始化,则初始化

除了以上七种情况,其它使用Java类的方式都被看做是类的被动使用。都不会导致类的初始化


附:永久代与元空间区别

永久代与元空间区别:

  • 永久代使用的是JVM内存,元空间使用的是本地内存,元空间的数据分配只受到本地内存大小限制

  • 元空间与永久代区别是其内存空间直接使用的是本地内存,元空间中没有了字符串常量池;

  • 元空间其他存储的东西,包括类文件,在JAVA虚拟机运行时的数据结构,以及class相关的内容,如Method,Field理论上都与永久代一样,只是划分上更趋于合理,比如说类及相关的元数据的生命周期与类加载器一致,每个加载器都会分配一个单独的存储空间。

元空间好处:

  • 字符串常量池存在于永久代中,容易出现性能问题和内存溢出

  • 类的方法的信息大小又难以确定,因此给永久带的大小指定比较困难,太小容易出现永久代溢出,太大则容易导致老年代溢出。永久带会为GC带来不必要的复杂性,并且回收效率偏低,在永久代中元数据可能会随着每一次赋GC发生而进行移动,而 hotspot虚拟机每种类型的垃圾回收器都要特殊处理永久代中的元数据,分离出来以后可以简化赋GC,以及以后并发隔离元数据等方面进行优化。

posted @ 2021-08-11 23:38  稷下学员  阅读(23)  评论(0)    收藏  举报