深入理解JVM - JVM编译器

前端编译器

将源代码转化成字节码,如javac;我们一般称 javac 编译器为前端编译器,因为其发生在整个编译的前期。javac编译过程大致可以分为1个准备过程和3个处理过程,它们分别如下所示。

  1. 准备过程:初始化插入式注解处理器,java是支持注解的。
  2. 解析与填充符号表过程,包括: a. 词法、语法分析。将源代码的字符流转变为标记集合,构造出抽象语法树。 b. 填充符号表。产生符号地址和符号信息。
  3. 插入式注解处理器的注解处理过程:插入式注解处理器的执行阶段,本章的实战部分会设计一个插入式注解处理器来影响Javac的编译行为。
  4. 分析与字节码生成过程,包括: a. 标注检查。对语法的静态信息进行检查。 b. 数据流及控制流分析。对程序动态运行过程进行检查。 c. 解语法糖。将简化代码编写的语法糖还原为原有的形式。 d. 字节码生成。将前面各个步骤所生成的信息转化成字节码。

JIT编译器(即时编译器)

将字节码转换成机器码,如HotSpot VM的C1和C2编译器。

当源代码转化为字节码之后,程序要运行程序,有两种选择:一种是使用 Java 解释器解释执行字节码,另一种则是使用编译器将字节码转化为本地机器代码。

  • 解释器执行:将编译好的字节码一行一行地翻译为机器码执行,程序启动速度快,但是运行速度慢;
  • 编译器执行:以方法为单位,将字节码一次性翻译为机器码后执行,程序启动速度慢,但是运行速度快。

在整个Java虚拟机执行架构里,解释器与编译器经常是相辅相成地配合工作,当虚拟机发行某个方法执行特别频繁时,就会把这些代码判定成“热点代码”,为了提高热点代码的执行效率,在运行时,虚拟机将会把这些代码编译成本地机器码,并以各种手段尽可能地进行代码优化,运行时完成这个任务的后端编译器被称为即时编译器。当执行JIT编译后的机器码出现问题时,那么虚拟机又会使用解释器来执行代码。

在 HotSpot 虚拟机内置了多个即时编译器,分别称为 Client 编译器(C1)、Server 编译器(C2)和graal编译器。

  • C1:即Client编译器,面向对启动性能有要求的客户端GUI程序,将字节码转换为机器码时只进行简单、可靠的优化,因此编译的时间较短,通过-client参数打开。
  • C2:即Server编译器,面向对性能峰值有要求的服务端程序,将字节码转换为机器码时会进行激进、复杂的优化,因此编译时间长,但是在运行过程中性能更好,通过-server参数打开。
  • graal:graal是JDK10引入的一个编译器,目的是用来替换C2编译器。

虚拟机执行模式

虚拟机有三种执行模式:混合模式(Mixed Mode)、解释模式(Interpreted Mode)和编译模式(CompiledMode),默认是混合模式。

  • 混合模式(Mixed Mode):解释器与编译器搭配使用的方式在虚拟机中被称为“混合模式”(Mixed Mode)。
  • -Xint:指定虚拟机使用“解释模式”(Interpreted Mode),代码都使用解释方式执行;
  • -Xcomp:指定虚拟机使用“编译模式”,代码优先采用编译方式执行程序,但是当编译后的代码无法正常执行时,这时使用解释执行来兜底;

编译器优化

为了在程序启动响应速度与运行效率之间达到最佳平衡,HotSpot虚拟机在编译子系统中加入了分层编译的功能,分层编译根据编译器编译、优化的规模与耗时,划分出不同的编译层次,其中包括:

  • 第0层:程序只使用解释执行,并且解释器不开启性能监控功能(Profiling)。
  • 第1层:使用客户端编译器将字节码编译为本地代码来运行,进行简单可靠的稳定优化,不开启性能监控功能。
  • 第2层:仍然使用客户端编译器执行,仅开启方法及回边次数统计等有限的性能监控功能。
  • 第3层:仍然使用客户端编译器执行,开启全部性能监控,除了第2层的统计信息外,还会收集如分支跳转、虚方法调用版本等全部的统计信息。
  • 第4层:使用服务端编译器将字节码编译为本地代码,相比起客户端编译器,服务端编译器会启用更多编译耗时更长的优化,还会根据性能监控信息进行一些不可靠的激进优化。

以上层次并不是固定不变的,根据不同的运行参数和版本,虚拟机可以调整分层的数量。分层编译的交互关系,如下:

-XX:+TieredCompilation,开启分层编译,可以让jvm在启动时启用client编译,随着代码变热后再转为server编译。

热点探测

对于程序来说,通常只有一部分代码被经常执行,这些关键代码被称为应用的热点,执行的越多就认为是越热,将这些代码编译为本地机器特定的二进制码,可以有效提高应用性能。目前主流的热点探测判定方式有两种,分别是:

  • 基于采样的热点探测(Sample Based Hot Spot Code Detection)。采用这种方法的虚拟机会周期性地检查各个线程的调用栈顶,如果发现某个(或某些)方法经常出现在栈顶,那这个方法就是“热点方法”。基于采样的热点探测的好处是实现简单高效,还可以很容易地获取方法调用关系(将调用堆栈展开即可),缺点是很难精确地确认一个方法的热度,容易因为受到线程阻塞或别的外界因素的影响而扰乱热点探测。
  • 基于计数器的热点探测(Counter Based Hot Spot Code Detection)。采用这种方法的虚拟机会为每个方法(甚至是代码块)建立计数器,统计方法的执行次数,如果执行次数超过一定的阈值就认为它是“热点方法”。这种统计方法实现起来要麻烦一些,需要为每个方法建立并维护计数器,而且不能直接获取到方法的调用关系。但是它的统计结果相对来说更加精确严谨。

AOT编译器

将源代码直接编译成机器码,称为提前编译器(AOT编译器),如:Jaotc;

提前编译器主要的优点:

  • 提前编译器不会占用程序的运行时间和运算资源,但是及时编译器会,这也是即时编译器的最大弱点。
  • 可以作为即时编译器的缓存,改善程序的启动时间。

提前编译器主要的缺点,也是即时编译器的优点:

  • 不能进行性能分析制导优化(Profile-Guided Optimization,PGO),因为提前编译不能收集到程序的运行时监控数据,无法定位热点代码,所以不能集中优化和分配更好的资源进行制导优化。
  • 不能进行激进预测性优化,因为提前编译器编器必须保证优化后的程序一定能正常运行,所以不能进行一些激进优化。
  • 不能进行链接时优化(Link-Time Optimization,LTO),因为主程序与动态链接库的代码在它们编译时是完全独立的,两者各自编译、优化自己的代码,所以提前编译器无法进行链接时优化,但是程序运行时会将所有的Class加载到虚拟机中,所以即时编译器可以进行链接时优化

总结

从应用启动速度来看:解释执行 > AOT 编译器 > JIT 编译器。 从应用运行速度来看: JIT 编译器> AOT 编译器 > 解释执行。

JVM虚拟为了保持程序启动时间和运行效率的平衡,一般会使用多种方式配合工作。

参考

《深入理解JAVA虚拟机》