执行引擎
概述
- jvm的主要任务是负责装在字节码到其内部,但是字节码指令不等价于本地机器指令
- 由执行引擎将字节码指令解释为对应平台上的本地机器指令
- 执行引擎在执行的过程中究竟需要执行什么样的字节码指令完全依赖于Pc寄存器
- PC寄存器始终保存着下一条需要被执行的指令地址
- 执行引擎采用解释器和即时编译器并存的架构(HotSp VM)
工作流程
源代码(source code)→ 预处理器(preprocessor)→ 编译器(compiler)→ 汇编程序(assembler)→ 目标代码(object code)→ 链接器(linker)→ 可执行文件(executables)
解释器
解释器(interpreter)边解释边执行,根据预定义的规范对字节码采用逐行解释的方式执行,将每条字节码的内容"翻译"为对应平台的本地机器指令执行
即时编译器
- 即时编译(just-in-time compilation,缩写为JIT;又叫及时编译、实时编译),也称为动态翻译或运行时编译,是一种执行计算机代码的方法,在程序执行过程中(在执行期)而不是在执行之前进行编译。即虚拟机将源代码直接编译成和本地机器平台相关的机器语言。
- 由于加载和编译字节码所需的时间,JIT在应用程序的初始执行中会导致轻微到明显的延迟。有时这种延迟被称为“启动时间延迟”或“预热时间”。一般来说,JIT执行的优化越多,生成的代码就越好,但是初始延迟也会增加。
机器码
机器语言是用二进制代码表示的、计算机能直接识别和执行的一种机器指令的集合
指令
指令就是把机器码中特定的0和1序列,简化成对应的指令
汇编语言
汇编语言(assembly language)是任何一种用于电子计算机、微处理器、微控制器,或其他可编程器件的低级语言。在不同的设备中,汇编语言对应着不同的机器语言指令集。一种汇编语言专用于某种计算机系统结构。
HotSpot的执行方式
当虚拟机启动的时候,解释器首先发挥作用,而不必等待即时编译器全部编译完成再执行,这样可以省去许多不必要的编译时间。并且随着程序运行时间的推移,即时编译器逐渐发挥作用,根据热点探测功能,将有价值的字节码编译为本地机器指令,以换取更高的程序执行效率。
热点代码
一个被多次调用的方法,或者是一个方法体内部循环次数较多的循环体都可以被称之为“热点代码”,因此都可以通过JIT编译器编译为本地机器指令。由于这种编译方式发生在方法的执行过程中,因此也被称之为栈上替换,或简称为OSR (On StackReplacement)编译。
探测方式
- 一个方法究竟要被调用多少次,或者一个循环体究竟需要执行多少次循环才可以达到这个标准?必然需要一个明确的阈值,JIT编译器才会将这些“热点代码”编译为本地机器指令执行。这里主要依靠热点探测功能
- 目前HotSpot VM所采用的热点探测方式是基于计数器的热点探测
- 采用基于计数器的热点探测,HotSpot VM将会为每一个方法都建立2个不同类型的计数器,分别为方法调用计数器(Invocation Counter)和回边计数器(BackEdge Counter)
- 方法调用计数器:统计方法的调用次数
- 回边计数器:统计循环体执行的循环次数
方法调用计数器
- 默认阙值在 Client 模式下是1500次,在 Server 模式下是10000次,超过这个阙值就会触发JIT编译
- 可用通过参数 -XX:CompileThreshold来设置阙值,例如-XX:CompileThreshold=2
- 当一个方法被调用时,会先检查该方法是否存在被JIT编译过的版本,如果存在,则优先使用编译后的本地代码来执行。如果不存在已被编译过的版本,则将此方法的调用计数器值加1,然后判断方法调用计数器与回边计数器值之和是否超过方法调用计数器的阈值。如果已超过阈值,那么将会向即时编译器提交一个该方法的代码编译请求
- 方法调用计数器统计的是一个相对的执行频率,即超过一定的时间限度后方法的调用次数还不到阙值,这个方法的调用计数器就会减少一半,这个过程称为方法调用计数器的热度衰减,这段时间被称为此方法统计的半衰周期
- 可用使用参数 -XX:-UseCounterDecay 关闭热度衰减、-XX:CounterHalfLifeTime(只能在测试版的VM使用)设置半衰周期的时间,单位是秒
回边计数器
计循环体执行的循环次数,在字节码中遇到控制流向后跳转的指令称为"回边"
参数
- -Xint:完全采用解释器模式执行程序
- -Xcomp:完全采用即时编译器模式执行程序,如果即时编译出现问题,解释器会介入
- -Xmixed:采用解释器+即时编译器的混合模式执行程序
JIT分类
- 在HotSpot VM中内嵌有两个JIT编译器,分别为client Compiler和server Compiler
- -client: 指定Java虚拟机运行在Client模式下,并使用C1编译器
- -server:指定Java虚拟机运行在Server模式下,并使用C2编译器
- C2进行耗时较长的优化,以及激进优化。但优化的代码执行效率更高
- C1编译器优化策略:
5.1 方法内联:将引用的函数代码编译到引用点处,这样可用减少栈帧的使用,减少参数传递以及跳转过程
5.2 去虚拟化:对唯一的实现类进行内联
5.3 冗余消除:在运行期间把一些不会执行的代码折叠掉 - C2编译器优化策略:逃逸分析是优化的基础
6.1 标量替换:用标量值替换聚合对象的属性值
6.2 栈上分配:对于未逃逸的对象分配对象在栈上而不是堆
6.3 同步消除:消除同步动作,通常指synchronized - 分层编译(Tiered compilation)策略:程序解释执行(不开启性能监控)可以触发c1编译,将字节码编译成机器码,可以进行简单优化,也可以加上性能监控,C2编译会根据性能监控信息进行激进优化
- JIT编译出来的机器码性能比解释器高
- C2编译器启动时长比c1编译器慢,系统稳定执行以后,c2编译器执行速度远远快于c1编译器