简介
我们知道在JVM中为了加快编译速度,引入了JIT即时编译的功能。那么JIT什么时候开始编译的,又是怎么编译的,作为一个高傲的程序员,有没有办法去探究JIT编译的秘密呢?答案是有的,今天和小师妹一起带大家来看一看这个编译背后的秘密。
LogCompilation简介
小师妹:F师兄,JIT这么神器,但是好像就是一个黑盒子,有没有办法可以探寻到其内部的本质呢?
追求真理和探索精神是我们作为程序员的最大优点,想想如果没有玻尔关于原子结构的新理论,怎么会有原子体系的突破,如果没有海森堡的矩阵力学,怎么会有量子力学的建立?
JIT的编译日志输出很简单,使用
代码语言:javascript复制-XX: LogCompilation
就够了。
如果要把日志重定向到一个日志文件中,则可以使用
代码语言:javascript复制-XX:LogFile=
但是要开启这些分析的功能,又需要使用
代码语言:javascript复制-XX: UnlockDiagnosticVMOptions
所以总结一下,我们需要这样使用:
代码语言:javascript复制-XX: UnlockDiagnosticVMOptions -XX: LogCompilation -XX:LogFile=www.flydean.com.log
LogCompilation的使用
根据上面的介绍,我们现场来生成一个JIT的编译日志,为了体现出专业性,这里我们需要使用到JMH来做性能测试。
JMH的全称是Java Microbenchmark Harness,是一个open JDK中用来做性能测试的套件。该套件已经被包含在了JDK 12中。
如果你使用的不是JDK 12,那么需要添加如下依赖:
代码语言:javascript复制<dependency>
<groupId>org.openjdk.jmh</groupId>
<artifactId>jmh-core</artifactId>
<version>1.19</version></dependency><dependency>
<groupId>org.openjdk.jmh</groupId>
<artifactId>jmh-generator-annprocess</artifactId>
<version>1.19</version>
</dependency>
更多详情可以参考我之前写的:在java中使用JMH(Java Microbenchmark Harness)做性能测试一文。
之前有的朋友说,代码也用图片,看起来好看,从本文之后,我们会尽量把代码也转成图片来展示:
看完我的JMH的介绍,上面的例子应该很清楚了,主要就是做一个累加操作,然后warmup 5轮,测试5轮。
在@Fork注解里面,我们可以配置jvm的参数,为什么我注释掉了呢?因为我发现在jvmArgsPrepend中的-XX:LogFile是不生效的。
没办法,我只好在运行配置中添加:
运行之后,你就可以得到输出的编译日志文件。
解析LogCompilation文件
小师妹:F师兄,我看了一下生成的文件好复杂啊,用肉眼能看得明白吗?
别怕,只是内容的多一点,如果我们细细再细细的分析一下,你会发现其实它真的非常非常……复杂!
其实写点简单的小白文不好吗?为什么要来分析这么复杂,又没人看,看了也没人懂的JVM底层…..
大概,这就是专业吧!
LogCompilation文件其实是xml格式的,我们现在来大概分析一下,它的结构,让大家下次看到这个文件也能够大概了解它的重点。
首先最基本的信息就是JVM的信息,包括JVM的版本,JVM运行的参数,还有一些properties属性。
我们收集到的日志其实是分两类的,第一类是应用程序本身的的编译日志,第二类就是编译线程自己内部产生的日志。
第二类的日志会以hs_c*.log的格式存储,然后在JVM退出的时候,再将这些文件跟最终的日志输出文件合并,生成一个整体的日志文件。
比如下面的两个就是编译线程内部的日志:
代码语言:javascript复制<thread_logfile thread='22275' filename='/var/folders/n5/217y_bgn49z18zvjch907xb00000gp/T//hs_c22275_pid83940.log'/>
<thread_logfile thread='41731' filename='/var/folders/n5/217y_bgn49z18zvjch907xb00000gp/T//hs_c41731_pid83940.log'/>
上面列出了编译线程的id=22275,如果我们顺着22275找下去,则可以找到具体编译线程的日志:
代码语言:javascript复制<compilation_log thread='22275'>...</compilation_log>
上面由compilation_log围起来的部分就是编译日志了。
接下来的部分表示,编译线程开始执行了,其中stamp表示的是启动时间,下图列出了一个完整的编译线程的日志:
代码语言:javascript复制<start_compile_thread name='C2 CompilerThread0' thread='22275' process='83940' stamp='0.058'/>
接下来描述的是要编译的方法信息:
代码语言:javascript复制<task compile_id='10' method='java.lang.Object <init> ()V' bytes='1' count='1409' iicount='1409' stamp='0.153'>
上面列出了要编译的方法名,compile_id表示的是系统内部分配的编译id,bytes是方法中的字节数,count表示的是该方法的调用次数,注意,这里的次数并不是方法的真实调用次数,只能做一个估计。
iicount是解释器被调用的次数。
task执行了,自然就会执行完成,执行完成的内容是以task_done标签来表示的:
代码语言:javascript复制<task_done success='1' nmsize='120' count='1468' stamp='0.155'/>
其中success表示是否成功执行,nmsize表示编译器编译出来的指令大小,以byte为单位。如果有内联的话,还有个inlined_bytes属性,表示inlined的字节个数。
代码语言:javascript复制<type id='1025' name='void'/>
type表示的是方法的返回类型。
代码语言:javascript复制<klass id='1030' name='java.lang.Object' flags='1'/>
klass表示的是实例和数组类型。
代码语言:javascript复制<method id='1148' holder='1030' name='<init>' return='1025' flags='1' bytes='1' compile_id='1' compiler='c1' level='3' iicount='1419'/>
method表示执行的方法,holder是前面的klass的id,表示的是定义该方法的实例或者数组对象。method有名字,有 return,return对应的是上面的type。
flags表示的是方法的访问权限。
接下来是parse,是分析阶段的日志:
代码语言:javascript复制<parse method='1148' uses='1419.000000' stamp='0.153'>
上面有parse的方法id。uses是使用次数。
代码语言:javascript复制<bc code='177' bci='0'/>
bc是byte Count的缩写,code是byte的个数,bci是byte code的索引。
代码语言:javascript复制<dependency type='no_finalizable_subclasses' ctxk='1030'/>
dependency分析的是类的依赖关系,type表示的是什么类型的依赖,ctkx是依赖的context class。
我们注意有的parse中,可能会有uncommon_trap:
代码语言:javascript复制<uncommon_trap bci='10' reason='unstable_if' action='reinterpret' debug_id='0' comment='taken never'/>
怎么理解uncommon_trap呢?字面上意思就是捕获非常用的代码,就是说在解析代码的过程中发现发现这些代码是uncommon的,然后解析产生一个uncommon_trap,不再继续进行了。
它里面有两个比较重要的字段,reason表示的是被标记为uncommon_trap的原因。action表示的出发uncommon_trap的事件。
有些地方还会有call:
代码语言:javascript复制<call method='1150' count='5154' prof_factor='1.000000' inline='1'/>
call的意思是,在该代码中将会调用其他的方法。count是执行次数。
总结
复杂的编译日志终于讲完了,可能讲的并不是很全,还有一些其他情况这里并没有列出来,后面如果遇到了,我再添加进去。