Class 类文件的结构


Class文件是一组以字节为基础单位的二进制流Class文件中各个数据项目严格按照顺序紧凑地排列,数据项目之间不存在任何分隔符号,这使得整个Class文件中存储的内容几乎全部是程序运行的必要数据,没有空隙存在。当遇到需要占用1字节以上空间的数据项时,则按照高位在前的方式分割成多个字节进行存储。

根据Java虚拟机规范的规定,Class文件格式采用一种类似于C语言结构体的伪结构来存储数据,这种伪结构中只有两种数据类型:无符号数和表。

无符号数属于基本的数据类型,以u1、u2、u4、u8来分别代表1字节、2字节、4字节、8字节的无符号数,无符号数可以用来描述数字、索引引用、数量值或者按照UTF-8编码构成字符串值。

是由多个无符号数或者其他表作为数据项而构成的复合数据类型,所有表都习惯性地以"_info"结尾。表是用于描述有层次关系的复合结构的数据,整个Class文件本质上就是一张表。

构成Class文件这张“表”的各数据项如下表1所示:

表1 Class文件格式
类型 名称 数量
u4 magic 1
u2 minor_version 1
u2 major_version 1
u2 constant_pool_count 1
cp_info constant_pool constant_pool_count - 1
u2 access_flags 1
u2 this_class 1
u2 super_class 1
u2 interfaces_count 1
u2 interfaces interfaces_count
u2 fields_count 1
field_info fields fields_count
u2 methods_count 1
method_info methods methods_count
u2 attributes_count 1
attribute_info attributes attributes_count

无论是无符号数还是表,当需要描述同一类型但数量不定的多个数据时,经常会使用一个前置的容量计数器加若干个连续数据项的形式,这是称这一系列连续的某以类型的数据为某一类型的集合。

总结

Class文件的结构不像XML等描述性语言,由于没有任何分隔符号,表1中的所有数据项无论是顺序还是数量,甚至于数据存储的字节序这样的细节,都是被严格限定的,哪个字节代表什么含义,长度是多少,先后顺序如何,都不允许改变。


《深入理解Java虚拟机》阅读笔记