深入理解JVM(③)HotSpot虚拟机对象探秘

前言

上篇文章介绍了Java虚拟机的运行时数据区域,大致明白了Java虚拟机内存模型的概况,下面就基于实用优先的原则,以最常用的虚拟机HotSpot和最常用的内存区域Java堆为例,升入探讨一下HotSpot虚拟机在Java堆中对象分配、布局和访问的全过程。

对象的创建

Java是一门面向对象的编程语言,在Java程序的运行过程中每时每刻都有对象被创建出来,那么在虚拟机中,对象的创建是怎样的一个过程呢?
当Java虚拟机遇到一条字节码new指令时,首先检查这个指令的参数是否能定位到一个类的符号引用,然后检查这个类是否已经被加载、解析和初始化过。如果没有,那么先执行类型的加载过程。

为对象分配空间

在类加载检查通过后,接下来虚拟机将为新生对象分配内存。为对象分配空间的任务实际上便等同于把一块确定大小的内存块儿从Java堆中划分出来。
在解释Java堆是如何为对象分配空间的时候,先解释两个虚拟机常用的分配空间方式。

  • 指针碰撞
    当一块儿内存中的空间是绝对规整的时候,就是说,所有被使用过的内存放在一边,空闲的内存放在另一边,中间放着一个指针,作为分界点的指示器,当分配内存是,就仅仅是把指针向空闲的方向挪动一段与对象大小相等的距离,这种分配方式称为“指针碰撞”(Bump The Pointer)。
  • 空闲列表
    当一块儿内存的空间不是规整的时候,已被使用的内存和空闲的内存相互交错在一起,那就没办法简单地进行指针碰撞了,虚拟机就必须维护一个列表,记录哪些内存块是可用的,在分配的时候从列表中找到一块足够大的空间划分给对象实例,并更新列表上的记录,这种分配方式称为“空闲列表”(Free List)。
    具体选择哪种分配方式,是由Java堆中的内存空间是否规则来决定的,而Java堆是否规整有由所采用的垃圾收集器是否带有空间压缩整理的能力决定。所以,当使用Serial、ParNew等带压缩整理过的的收集器是,对象的分配方式是指针碰撞,而当使用CMS这种基于清除算法的收集器是,理论上就只能采用较为复杂的空闲列表来分配内存。

对象创建的线程安全

在对象创建的时候,除了如何划分可用空间外,还有一个问题,那就是在分配内存空间的时候如何保证线程安全。
解决这个问题有两种方案:

  • 一种是对分配内存空间的动作进行同步处理——实际上虚拟机是采用CAS配上失败重试的方式保证更新操作的原子性;
  • 另外一种是把内存分配的动作按照线程划分在不同的空间之中进行,即每个线程在Java堆中预先分配一小块内存,称为本地线程分配缓冲(Thread Local Allcation Buffer,TLAB),哪个线程要分配内存,就在哪个线程的本地缓冲区中分配,只有本地缓冲区用完了,分配新的缓冲区时,才需要同步锁定。

在保证了线程安全的为对象分配了内存空间后,从虚拟机的视角来看,一个新的对象已经产生了。
但是从Java程序的视角看来,对象创建才刚刚开始,构造函数,也就是Class文件中的< init >方法还没有执行,new 指令之后会执行< init >方法,
按照程序员的意愿对对象进行初始化,这样一个真正可用的对象才算完全被构造出来。

对象的内存布局

在HotSpot虚拟机里,对象在堆内存中的存储布局可以划分为三个部分:对象头(Header)实例数据(Insetance Data) 和对齐填充(Padding)

对象头

HotSpot虚拟机对象的对象头包括两类信息。

  • 第一类是用于存储对象自身运行时数据,如哈希码(HashCode)、GC分代年龄、锁状态标志等。这部分数据的长度在32位和64位的虚拟机中分别为32个比特和64个比特,称为 “ Mark Word ” 。
  • 对象头的另外一部分是类型指针,即对象指向它的类型元数据的指针,Java虚拟机通过这个指针来确定该对象是哪个类的实例。如果对象是一个Java数组,那在对象头中还必须有一块用于记录数组长度的数据,因为需要通过数组的长度来确定对象的大小。

实例数据

实例数据是对象真正存储的有效信息,即我们在程序代码里面所定义的各种类型的字段内容,无论是从父类继承下来的,还是在子类中定义的字段都必须记录起来。这部分的存储顺序会受到虚拟机分配策略参数(-XX:FieldsAllocationStyle参数)和字段在Java源码中定义顺序的影响。

对齐填充

由于HotSpot虚拟机的自动内存管理系统要求对象起始地址必须是8字节的整数倍,换句话说就是任何对象的大小都必须是8字节的整数倍。对象头部分已经被精心设计成正好是8字节的倍数(1倍或2倍),因此如果对象实例数据部分没哟对齐的话就需要通过对齐填充来补全。所以对齐填充为,并不是必然存在的一部分占位符。

对象的访问定位

对象创建完成后就可以使用了,对象的定位是根据栈中的引用数据,来确定对象在内存中的位置的。那么如何通过引用数据定位到堆中的对象位置呢?
主流的访问方式主要有使用句柄直接指针两种:

  • 如果使用句柄访问的话,Java堆中将可能会划分出一块内存来作为句柄池,引用数据中存储的就是对象的句柄地址,而句柄中包含了对象实例数据与类型数据各自具体的地址信息。
  • 如果使用直接指针访问的话,Java堆中对象的内存布局就必须考虑如何放置访问类型数据的相关信息,引用数据中存储的直接就是对象地址,这样访问对象更快捷。

使用句柄,在对象被移动(垃圾收集时)时只会改变句柄中的数据指针,而直接指针节省了一次指针定位的时间开销速度更快!

posted @ 2020-02-02 22:22  纪莫  阅读(434)  评论(0编辑  收藏  举报