1 对象的创建过程
当JVM遇到一条含有new的指令时,会进行一系列对象创建的操作:
1.1 检查常量池中,是否有待创建对象所属类的符号引用
- 若常量池中无此类的符号引用,说明该类还没有被定义!直接抛ClassNotFoundException
- 若常量池中有此类的符号引用,则走2
1.2 检查该符号引用所代表的类,是否已被JVM加载
- 若该类尚未被加载 就找该类的class文件,并加载进方法区
- 若该类已被JVM加载 准备为对象分配内存
1.3 根据方法区中该类的信息,确定该类所需的内存大小
一个对象所需的内存大小,是在该对象所属的类被定义完就能确定的!且一个类所生产的所有对象的内存大小一样!
JVM在一个类被加载进方法区时,就知该类生产的每个对象所需要的内存大小。
从堆中划分一块对应大小的内存空间给新的对象,分配堆中的内存有两种方式:
指针碰撞(Bump the Pointer)
若垃圾收集器采用复制算法或标记-整理算法,则堆中空闲内存是完整的区域,并且空闲内存和已使用内存之间由一个指针标记。那么当为一个对象分配内存时,只需移动指针。
因此这种在完整空闲区域上,通过移动指针来分配内存的方式就叫"指针碰撞"。
空闲列表 (Free List)
若垃圾收集器采用标记-清除算法,则堆中空闲区域和已用区域交错,因此需要用一张“空闲列表”记录堆中哪些区域是空闲区域,从而在创建对象时,根据这张“空闲列表”找到空闲区域,并分配内存。
综上,JVM究竟采用哪种内存分配方法,取决于使用何种垃圾收集器。 为对象中的成员变量赋上初始值(默认初始化);
1.4 设置对象头(Object Header)
1.5 调用对象的构造函数进行初始化
至此,整个对象的创建过程就完成。
2 对象的内存布局(Java对象结构)
一个对象,从逻辑角度看,由如下构成:
- 成员变量
- 成员函数
物理角度来看,对象是存储在堆中的一串二进制数,而对象在内存中存储的布局分为:
2.1 对象头(Object Header)
- 存储对象在运行过程中自身所需要的一些数据 哈希码、GC分代年龄、锁状态标志、线程持有的锁、偏向线程ID、偏向时间戳等。是实现锁机制的关键
- 类型指针,对象指向它的类元数据的指针 JVM通过该指针能确定该对象是哪个类的实例。若对象是个数组,则对象头中还要包含数组长度(因为从数组的元数据无法确定数组的大小!)
2.2 实例数据(Instance Data)
程序定义的各种字段的内容,包含父类和子类的都会记录下来。
描述真实的对象数据,包括了对象中的所有字段属性信息,它们可能是某个其它对象的地址引用,也可能是基础数据的数据值。
2.3 对齐补充(Padding)
并非必然存在,无特别含义,仅起占位符作用。 HotSpot要求对象的大小必须是8字节整数倍。由于对象起始地址必须是8字节整数倍,但实例数据部分的长度是任意的,因此需要对齐补充字段,确保整个对象的总长度为8整数倍。
编译器将Java类编译成 .class 文件,当类加载器将 class 文件载入JVM,会生成一个对应的 Klass 类型的对象(C ),即类的描述元数据,存储在方法区。
每当 new 对象时,都是根据类的描述元数据 Klass 创建对象oop,并且存储在堆中,存储在堆里的对象oop的结构图:
3 访问对象的过程
栈上的reference数据存放的是一个地址,根据地址类型的不同,对象有不同访问方式:
3.1 句柄访问方式
Java堆中要有块叫做"句柄池"的内存,存放所有对象的地址和所有对象所属类的类信息:
reference中存放的是对象在句柄池中的地址。访问对象时,首先通过reference找到该对象的句柄,然后根据句柄中对象的地址再访问对象。
3.2 直接指针访问方式
reference直接存放对象地址,从而不需要句柄池,通过引用能够直接访问对象。但对象所在的内存空间中需要额外的策略存储对象所属的类信息的地址。
3.3 比较
使用句柄最大好处是reference中存储的是稳定的句柄地址,在对象被移动时也只改变句柄中的实例数据指针,而reference本身不需要修改。
HotSpot采用直接指针访问方式,因其只需一次寻址操作,节省了一次指针定位的时间开销,而对象的访问又十分频繁,从而性能比句柄访问方式快一倍。