JIT中的LogCompilation

2020-07-07 15:51:39 浏览数 (1)

简介

我们知道在JVM中为了加快编译速度,引入了JIT即时编译的功能。那么JIT什么时候开始编译的,又是怎么编译的,作为一个高傲的程序员,有没有办法去探究JIT编译的秘密呢?答案是有的,今天和小师妹一起带大家来看一看这个编译背后的秘密。

LogCompilation简介

小师妹:F师兄,JIT这么神器,但是好像就是一个黑盒子,有没有办法可以探寻到其内部的本质呢?

追求真理和探索精神是我们作为程序员的最大优点,想想如果没有玻尔关于原子结构的新理论,怎么会有原子体系的突破,如果没有海森堡的矩阵力学,怎么会有量子力学的建立?

JIT的编译日志输出很简单,使用

代码语言:javascript复制
-XX: LogCompilation

就够了。

如果要把日志重定向到一个日志文件中,则可以使用

代码语言:javascript复制
-XX:LogFile=

但是要开启这些分析的功能,又需要使用

代码语言:javascript复制
-XX: UnlockDiagnosticVMOptions

所以总结一下,我们需要这样使用:

代码语言:javascript复制
-XX: UnlockDiagnosticVMOptions -XX: LogCompilation -XX:LogFile=www.flydean.com.log

LogCompilation的使用

根据上面的介绍,我们现场来生成一个JIT的编译日志,为了体现出专业性,这里我们需要使用到JMH来做性能测试。

JMH的全称是Java Microbenchmark Harness,是一个open JDK中用来做性能测试的套件。该套件已经被包含在了JDK 12中。

如果你使用的不是JDK 12,那么需要添加如下依赖:

代码语言:javascript复制
<dependency>
    <groupId>org.openjdk.jmh</groupId>
    <artifactId>jmh-core</artifactId>
    <version>1.19</version></dependency><dependency>
    <groupId>org.openjdk.jmh</groupId>
    <artifactId>jmh-generator-annprocess</artifactId>
    <version>1.19</version>
 </dependency>

更多详情可以参考我之前写的:在java中使用JMH(Java Microbenchmark Harness)做性能测试一文。

之前有的朋友说,代码也用图片,看起来好看,从本文之后,我们会尽量把代码也转成图片来展示:

看完我的JMH的介绍,上面的例子应该很清楚了,主要就是做一个累加操作,然后warmup 5轮,测试5轮。

在@Fork注解里面,我们可以配置jvm的参数,为什么我注释掉了呢?因为我发现在jvmArgsPrepend中的-XX:LogFile是不生效的。

没办法,我只好在运行配置中添加:

运行之后,你就可以得到输出的编译日志文件。

解析LogCompilation文件

小师妹:F师兄,我看了一下生成的文件好复杂啊,用肉眼能看得明白吗?

别怕,只是内容的多一点,如果我们细细再细细的分析一下,你会发现其实它真的非常非常……复杂!

其实写点简单的小白文不好吗?为什么要来分析这么复杂,又没人看,看了也没人懂的JVM底层…..

大概,这就是专业吧!

LogCompilation文件其实是xml格式的,我们现在来大概分析一下,它的结构,让大家下次看到这个文件也能够大概了解它的重点。

首先最基本的信息就是JVM的信息,包括JVM的版本,JVM运行的参数,还有一些properties属性。

我们收集到的日志其实是分两类的,第一类是应用程序本身的的编译日志,第二类就是编译线程自己内部产生的日志。

第二类的日志会以hs_c*.log的格式存储,然后在JVM退出的时候,再将这些文件跟最终的日志输出文件合并,生成一个整体的日志文件。

比如下面的两个就是编译线程内部的日志:

代码语言:javascript复制
<thread_logfile thread='22275' filename='/var/folders/n5/217y_bgn49z18zvjch907xb00000gp/T//hs_c22275_pid83940.log'/>
<thread_logfile thread='41731' filename='/var/folders/n5/217y_bgn49z18zvjch907xb00000gp/T//hs_c41731_pid83940.log'/>

上面列出了编译线程的id=22275,如果我们顺着22275找下去,则可以找到具体编译线程的日志:

代码语言:javascript复制
<compilation_log thread='22275'>...</compilation_log>

上面由compilation_log围起来的部分就是编译日志了。

接下来的部分表示,编译线程开始执行了,其中stamp表示的是启动时间,下图列出了一个完整的编译线程的日志:

代码语言:javascript复制
<start_compile_thread name='C2 CompilerThread0' thread='22275' process='83940' stamp='0.058'/>

接下来描述的是要编译的方法信息:

代码语言:javascript复制
<task compile_id='10' method='java.lang.Object <init> ()V' bytes='1' count='1409' iicount='1409' stamp='0.153'>

上面列出了要编译的方法名,compile_id表示的是系统内部分配的编译id,bytes是方法中的字节数,count表示的是该方法的调用次数,注意,这里的次数并不是方法的真实调用次数,只能做一个估计。

iicount是解释器被调用的次数。

task执行了,自然就会执行完成,执行完成的内容是以task_done标签来表示的:

代码语言:javascript复制
<task_done success='1' nmsize='120' count='1468' stamp='0.155'/>

其中success表示是否成功执行,nmsize表示编译器编译出来的指令大小,以byte为单位。如果有内联的话,还有个inlined_bytes属性,表示inlined的字节个数。

代码语言:javascript复制
<type id='1025' name='void'/>

type表示的是方法的返回类型。

代码语言:javascript复制
<klass id='1030' name='java.lang.Object' flags='1'/>

klass表示的是实例和数组类型。

代码语言:javascript复制
<method id='1148' holder='1030' name='<init>' return='1025' flags='1' bytes='1' compile_id='1' compiler='c1' level='3' iicount='1419'/>

method表示执行的方法,holder是前面的klass的id,表示的是定义该方法的实例或者数组对象。method有名字,有 return,return对应的是上面的type。

flags表示的是方法的访问权限。

接下来是parse,是分析阶段的日志:

代码语言:javascript复制
<parse method='1148' uses='1419.000000' stamp='0.153'>

上面有parse的方法id。uses是使用次数。

代码语言:javascript复制
<bc code='177' bci='0'/>

bc是byte Count的缩写,code是byte的个数,bci是byte code的索引。

代码语言:javascript复制
<dependency type='no_finalizable_subclasses' ctxk='1030'/>

dependency分析的是类的依赖关系,type表示的是什么类型的依赖,ctkx是依赖的context class。

我们注意有的parse中,可能会有uncommon_trap:

代码语言:javascript复制
<uncommon_trap bci='10' reason='unstable_if' action='reinterpret' debug_id='0' comment='taken never'/>

怎么理解uncommon_trap呢?字面上意思就是捕获非常用的代码,就是说在解析代码的过程中发现发现这些代码是uncommon的,然后解析产生一个uncommon_trap,不再继续进行了。

它里面有两个比较重要的字段,reason表示的是被标记为uncommon_trap的原因。action表示的出发uncommon_trap的事件。

有些地方还会有call:

代码语言:javascript复制
<call method='1150' count='5154' prof_factor='1.000000' inline='1'/>

call的意思是,在该代码中将会调用其他的方法。count是执行次数。

总结

复杂的编译日志终于讲完了,可能讲的并不是很全,还有一些其他情况这里并没有列出来,后面如果遇到了,我再添加进去。

0 人点赞