大佬带你深入解析java虚拟机:垃圾优先的垃圾回收器(G1 GC)

2022-10-31 11:28:03 浏览数 (1)

G1 GC

G1 GC是面向服务端应用程序的垃圾回收器,通过新的堆设计和停顿预测模型,可以到达用户指定的一个比较合理的软实时目标。本章将详细分析G1 GC的设计和实现。

G1 GC简介

基于Region的堆

G1 GC全称是Garbage-First Garbage Collector,即垃圾优先的垃圾回收器,可以使用-XX: UseG1GC开启。G1 GC(以下简称G1)抛弃了既有堆模型,它将整个堆划分为一些大小固定的内存块(Region),通过-XX:G1HeapRegionSize=<val>控制Region大小(注意每个Region的大小只能是1MB、2MB、4MB、8MB、16MB和32MB),如图11-1所示。

图11-1 基于Region的堆划分

G1没有抛弃弱分代假说,在图11-1中,每个Region仍然包含代纪类型,一个特别的类型是巨型Region(Humongous Region),如果用户分配的对象超过了单个Region的大小,那么将使用连续多个Region存放对象,并将这些Region都标记为巨型Region。除了图11-1中包含的五种Region类型外,G1还有一个Archive类型的Region,它包含的是不可变的数据,该类型用于支持AppCDS。有了基于Region的堆划分就会相应需要基于Region的垃圾回收策略,G1包含YGC、FGC和Mixed GC,不同的垃圾回收策略将清理不同类型的Region。

记忆集RSet

G1包含YGC、FGC和Mixed GC三种垃圾回收策略,其中,YGC和FGC与其他垃圾回收器类似:YGC只回收新生代Region,而FGC回收整个堆。独有的Mixed GC是一种Partial GC策略,它会回收所有新生代Region和部分老年代Region。

既然Mixed GC属于Partial GC,那么它也会面临跨代引用问题,因为它回收整个新生代和部分老年代Region,所以一个老年代Region的根集包括GC Root和从老年代Region指向老年代Region的引用(old->old),新生代Region根集包括GC Root和老年代Region指向新生代Region的引用(old->young)。

G1使用RSet记忆集记录这些跨代引用。在记忆集设计中一般包含两种方式:一种是points-into记忆集,它表示“哪些对象引用了我”;另一种是points-out记忆集,它记录的是“我引用了哪些对象”。G1同时使用两种方式,如图11-2所示。

图11-2 G1 RSet

假设有a.field = b,如果使用points-into记忆集,那么b拥有记忆集,它记录a的位置。如果使用points-out记忆集,那么a拥有记忆集,它记录b的位置。G1的记忆集RSet同时使用两种设计,首先使用points-into结构来记忆有哪些其他Region引用自身(即对象b所在Region记录引用自身的对象a所在Region),然后每个Region包含一个points-out的卡表结构,记录指向当前对象的对象的具体位置(即对象b所在Region的卡表的索引)。

在G1堆中,每个Region会关联一个RSet,后置写屏障(g1_write_barrier_post)捕获Mutator线程向对象写入的每个值。如果发现写入操作导致两个对象产生old->old或者old->young关系,那么可以更新RSet,并将对象写入线程局部的DirtyCardQueue(DCQ),当线程局部的DCQ已满后,再将DCQ放入全局的DirtyCardQueueSet(DCQS)。

出于性能考虑,写屏障内的代码应该尽可能简单和高效,g1_write_barrier_post只负责发现那些产生old->old或者old->young关系的修改,并将对象加入DCQ。后续处理DCQ中的对象及更新RSet的操作则由专门的Refine线程负责。Refine线程取出DCQS中的DCQ的对象,找到被该对象引用的对象,然后更新被引用对象所在的Region的RSet,如代码清单11-1所示:

代码清单11-1 更新RSet

代码语言:javascript复制
void G1ConcurrentRefineOopClosure::do_oop_work(T* p) {
T o = RawAccess<MO_VOLATILE>::oop_load(p);
if (CompressedOops::is_null(o)){ return; }
oop obj = CompressedOops::decode_not_null(o);
if (HeapRegion::is_in_same_region(p, obj)) {
return; // 如果对象和被引用对象在同一个Region中,则不需要处理
}
// 如果在不同Region中,则需找到被引用者所在Region的RSet
HeapRegionRemSet* to_rem_set = _g1h->heap_region_containing(obj)->rem_set();
// 在被引用者的RSet中添加关系
if (to_rem_set->is_tracked()) {
to_rem_set->add_reference(p, _worker_i);
}
}

停顿预测模型

前面提到Mixed GC回收整个新生代和部分老年代Region,对于部分老年代Region的选择也有些讲究。G1会根据历史数据进行数学运算,计算出本次回收需要选择的老年代Region数量,以此来达到用户设置的-XX:MaxGCPauseMillis时间,即满足用户期望的GC不能超过最长停顿时间。注意,如果这个时间设置得不合理,G1也达不到期望。

本文给大家讲解的内容是深入解析java虚拟机:垃圾优先的垃圾回收器

  1. 下篇文章给大家讲解的是深入解析java虚拟机:新生代垃圾回收;
  2. 觉得文章不错的朋友可以转发此文关注小编;
  3. 感谢大家的支持!

本文就是愿天堂没有BUG给大家分享的内容,大家有收获的话可以分享下,想学习更多的话可以到微信公众号里找我,我等你哦。

0 人点赞