JVM学习笔记——类加载和字节码技术篇
在本系列内容中我们会对JVM做一个系统的学习,本片将会介绍JVM的类加载和字节码技术部分
我们会分为以下几部分进行介绍:
- 类文件结构
- 字节码指令
- 编译期处理
- 类加载阶段
- 类加载器
- 运行期优化
类文件结构
这一小节我们将简单介绍一下类的文件结构部分,简单阅读一下以下内容即可
整体文件展示
首先我们通过一个简单的HelloWorld文件来进行类文件结构介绍
首先我们给出Java文件代码:
代码语言:javascript复制package cn.itcast.jvm.t5;
// HelloWorld 示例
public class HelloWorld {
public static void main(String[] args) {
System.out.println("hello world");
}
我们如果想要获取底层二进制代码,需要在out文件下输入以下命令:
代码语言:javascript复制// 获得底层二进制代码
javac -parameters -d . HellowWorld.java
然后我们就可以获得二进制代码:
代码语言:javascript复制// 当然目前你是完全看不懂的,我们这里只需要大概了解结构即可,不需要解读
[root@localhost ~]# od -t xC HelloWorld.class
0000000 ca fe ba be 00 00 00 34 00 23 0a 00 06 00 15 09
0000020 00 16 00 17 08 00 18 0a 00 19 00 1a 07 00 1b 07
0000040 00 1c 01 00 06 3c 69 6e 69 74 3e 01 00 03 28 29
0000060 56 01 00 04 43 6f 64 65 01 00 0f 4c 69 6e 65 4e
0000100 75 6d 62 65 72 54 61 62 6c 65 01 00 12 4c 6f 63
0000120 61 6c 56 61 72 69 61 62 6c 65 54 61 62 6c 65 01
0000140 00 04 74 68 69 73 01 00 1d 4c 63 6e 2f 69 74 63
0000160 61 73 74 2f 6a 76 6d 2f 74 35 2f 48 65 6c 6c 6f
0000200 57 6f 72 6c 64 3b 01 00 04 6d 61 69 6e 01 00 16
0000220 28 5b 4c 6a 61 76 61 2f 6c 61 6e 67 2f 53 74 72
0000240 69 6e 67 3b 29 56 01 00 04 61 72 67 73 01 00 13
0000260 5b 4c 6a 61 76 61 2f 6c 61 6e 67 2f 53 74 72 69
0000300 6e 67 3b 01 00 10 4d 65 74 68 6f 64 50 61 72 61
0000320 6d 65 74 65 72 73 01 00 0a 53 6f 75 72 63 65 46
0000340 69 6c 65 01 00 0f 48 65 6c 6c 6f 57 6f 72 6c 64
0000360 2e 6a 61 76 61 0c 00 07 00 08 07 00 1d 0c 00 1e
0000400 00 1f 01 00 0b 68 65 6c 6c 6f 20 77 6f 72 6c 64
0000420 07 00 20 0c 00 21 00 22 01 00 1b 63 6e 2f 69 74
0000440 63 61 73 74 2f 6a 76 6d 2f 74 35 2f 48 65 6c 6c
0000460 6f 57 6f 72 6c 64 01 00 10 6a 61 76 61 2f 6c 61
0000500 6e 67 2f 4f 62 6a 65 63 74 01 00 10 6a 61 76 61
0000520 2f 6c 61 6e 67 2f 53 79 73 74 65 6d 01 00 03 6f
0000540 75 74 01 00 15 4c 6a 61 76 61 2f 69 6f 2f 50 72
0000560 69 6e 74 53 74 72 65 61 6d 3b 01 00 13 6a 61 76
0000600 61 2f 69 6f 2f 50 72 69 6e 74 53 74 72 65 61 6d
0000620 01 00 07 70 72 69 6e 74 6c 6e 01 00 15 28 4c 6a
0000640 61 76 61 2f 6c 61 6e 67 2f 53 74 72 69 6e 67 3b
0000660 29 56 00 21 00 05 00 06 00 00 00 00 00 02 00 01
0000700 00 07 00 08 00 01 00 09 00 00 00 2f 00 01 00 01
0000720 00 00 00 05 2a b7 00 01 b1 00 00 00 02 00 0a 00
0000740 00 00 06 00 01 00 00 00 04 00 0b 00 00 00 0c 00
0000760 01 00 00 00 05 00 0c 00 0d 00 00 00 09 00 0e 00
0001000 0f 00 02 00 09 00 00 00 37 00 02 00 01 00 00 00
0001020 09 b2 00 02 12 03 b6 00 04 b1 00 00 00 02 00 0a
0001040 00 00 00 0a 00 02 00 00 00 06 00 08 00 07 00 0b
0001060 00 00 00 0c 00 01 00 00 00 09 00 10 00 11 00 00
0001100 00 12 00 00 00 05 01 00 10 00 00 00 01 00 13 00
0001120 00 00 02 00 14
类文件结构展示
首先我们给出类文件结构的整体展示:
代码语言:javascript复制ClassFile {
// 魔数
u4 magic;
// 类文件版本
u2 minor_version;
u2 major_version;
// 类文件常量池
u2 constant_pool_count;
cp_info constant_pool[constant_pool_count-1];
// 类文件的类型(public或private)
u2 access_flags;
// 子类父类介绍
u2 this_class;
u2 super_class;
// 接口介绍
u2 interfaces_count;
u2 interfaces[interfaces_count];
// 静态变量介绍
u2 fields_count;
field_info fields[fields_count];
// 方法介绍(包括静态方法,构造方法,正常方法)
u2 methods_count;
method_info methods[methods_count];
// 附加信息
u2 attributes_count;
attribute_info attributes[attributes_count];
}
魔数信息
首先我们给出魔数定义:
- 0~3 字节,表示它是否是【class】类型的文件
我们给出实例展示:
- 0000000 ca fe ba be 00 00 00 34 00 23 0a 00 06 00 15 09
版本信息
首先我们给出版本定义:
- 4~7 字节,表示类的版本 00 34(52) 表示是 Java 8
我们给出实例展示:
- 0000000 ca fe ba be 00 00 00 34 00 23 0a 00 06 00 15 09
常量池信息
首先我们给出常量池定义:
- 8~9 字节,表示常量池长度,00 23 (35) 表示常量池有 #1~#34项,注意 #0 项不计入,也没有值
我们给出实例展示:
- 0000000 ca fe ba be 00 00 00 34 00 23 0a 00 06 00 15 09
我们给出常量池的类型对应的十六进制标号:
Constant Type | Value |
---|---|
CONSTANT_Class | 7 |
CONSTANT_Fieldref | 9 |
CONSTANT_Methodref | 10 |
CONSTANT_InterfaceMethodref | 11 |
CONSTANT_String | 8 |
CONSTANT_Integer | 3 |
CONSTANT_Float | 4 |
CONSTANT_Long | 5 |
CONSTANT_Double | 6 |
CONSTANT_NameAndType | 12 |
CONSTANT_Utf8 | 1 |
CONSTANT_MethodHandle | 15 |
CONSTANT_MethodType | 16 |
CONSTANT_InvokeDynamic | 18 |
然后下述的34项全部都是常量内容,我们的常量通常分为以下几种:
信息表示 | 信息表示名 | 位数 | 含义 |
---|---|---|---|
0a | Method 信息 | 3 | 信息表示:调用类名:调用方法名 |
09 | Field 信息 | 3 | 信息表示:调用类名:调用静态方法名 |
08 | 字符串常量名称 | 2 | 信息表示:调用常量池位置 |
07 | Class 信息 | 2 | 信息表示:调用常量池位置 |
01 | utf8 串 | 3 | 信息表示:字符长度:字符意义 |
我们给出一些实例:
代码语言:javascript复制// 第#1项 0a 表示一个 Method 信息,00 06 和 00 15(21)
// 表示它引用了常量池中 #6 和 #21 项来获得这个方法的【所属类】和【方法名】
0a 00 06 00 15
// 第#2项 09 表示一个 Field 信息,00 16(22)和 00 17(23)
//表示它引用了常量池中 #22 和 # 23 项来获得这个成员变量的【所属类】和【成员变量名】
09 00 16 00 17
// 第#3项 08 表示一个字符串常量名称,00 18(24)表示它引用了常量池中 #24 项
08 00 18
// 第#5项 07 表示一个 Class 信息,00 1b(27) 表示它引用了常量池中 #27 项
07 00 1b
// 第#7项 01 表示一个 utf8 串,00 06 表示长度,3c 69 6e 69 74 3e 是【 <init> 】
00 06 3c 69 6e 69 74 3e
访问标识与继承信息
首先我们给出访问标识与继承信息定义:
- 一个字节表示该 class 是一个类的信息:00 21 公共的
- 一个字节表示根据常量池中位置找到本类全限定名:00 05 表示常量池#5
- 一个字节表示根据常量池中位置找到父类全限定名 :00 06 表示常量池#6
- 一个字节表示接口的数量: 00 00 表示接口数为0
我们给出访问标识与继承信息的一些信息列表:
Flag Name | Value | Interpretation |
---|---|---|
ACC_PUBLIC | 0x0001 | Declared public ; may be accessed from outside its package. |
ACC_FINAL | 0x0010 | Declared final ; no subclasses allowed. |
ACC_SUPER | 0x0020 | Treat superclass methods specially when invoked by the invokespecial instruction. |
ACC_INTERFACE | 0x0200 | Is an interface, not a class. |
ACC_ABSTRACT | 0x0400 | Declared abstract ; must not be instantiated. |
ACC_SYNTHETIC | 0x1000 | Declared synthetic; not present in the source code. |
ACC_ANNOTATION | 0x2000 | Declared as an annotation type. |
ACC_ENUM | 0x4000 | Declared as an enum type. |
成员变量信息
首先我们给出成员变量信息定义:
- 表示成员变量数量,本类为 0
我们给出实例展示:
- 0000660 29 56 00 21 00 05 00 06 00 00 00 00 00 02 00 01
我们给出成员变量的一些信息列表:
FieldType | Type | Interpretation |
---|---|---|
B | byte | signed byte |
C | char | Unicode character code point in the Basic Multilingual Plane, encoded with UTF-16 |
D | double | double-precision floating-point value |
F | float | single-precision floating-point value |
I | int | integer |
J | long | long integer |
L ClassName ; | reference | an instance of class ClassName |
S | short | signed short |
Z | boolean | true or false |
[ | reference | one array dimension |
方法信息
首先我们给出方法信息定义:
- 表示方法数量,本类为 2
我们给出实例展示:
- 0000660 29 56 00 21 00 05 00 06 00 00 00 00 00 02 00 01
一个方法由 访问修饰符,名称,参数描述,方法属性数量,方法属性组成,由于过于复杂这里不做展示
附加属性
首先我们给出方法信息定义:
- 00 01 表示附加属性数量
- 00 13 表示引用了常量池 #19 项,即【SourceFile】
- 00 00 00 02 表示此属性的长度
- 00 14 表示引用了常量池 #20 项,即【HelloWorld.java】
我们给出实例展示:
- 00 01 00 13 00 00 00 02 00 14
字节码指令
这一节我们将详细介绍字节码指令以及分析Java底层代码
字节码指令介绍
我们首先对之前的HelloWorld中的两个指令进行介绍
第一个指令是:
- 构造方法的字节码指令 :public cn.itcast.jvm.t5.HelloWorld();
其二进制代码为:
- 2a b7 00 01 b1
我们对其进行解释:
- 2a => aload_0 加载 slot 0 的局部变量,即 this,做为下面的 invokespecial 构造方法调用的参数
- b7 => invokespecial 预备调用构造方法,哪个方法呢?
- 00 01 引用常量池中 #1 项,即【 Method java/lang/Object."<init>"