PHP官方手册研读--php的垃圾回收机制

2023-09-18 15:44:42 浏览数 (2)

概述

php中何为垃圾

在PHP中,没有任何变量指向这个对象时,这个对象就成为垃圾;

垃圾的产生过程

代码语言:javascript复制
<?php
$a = array('one');
$a[] = &$a;
xdebug_debug_zval('a');

PHP

Copy

注意,xdebug_debug_zval函数是xdebug扩展的,使用前必须安装xdebug扩展,输出如下

代码语言:javascript复制
output:
a:(refcount=2, is_ref=1)
array (size=2)
	0 => (refcount=1, is_ref=0)string 'one' (length=3)
	1 => (refcount=2, is_ref=1)  &array<

PHP

Copy

这样a数组就有两个元素,一个索引为0,值为字符one,另外一个索引为1,为a自身的引用,内部存储如下: 那么问题就产生了,a已经不在符号表中,用户无法再访问此变量,但是a之前指向的zval的refcount_gc变为1而不是0,因此不能被回收,从而产生内存泄露,GC要做的工作就是清理此类垃圾。

算法(内存泄露)

PHP手册中有简单的介绍GC使用的垃圾清理算法,这个算法名为 Concurrent Cycle Collection in Reference Counted Systems(引用计数系统中的同步周期回收)。

  • 如果一个zval的refcount_gc增加,那么此zval还在使用,不属于垃圾
  • 如果一个zval的refcount减少到0, 那么zval可以被释放掉,不属于垃圾
  • 如果一个zval的refcount减少之后大于0,那么此zval还不能被释放,此zval可能成为一个垃圾

算法介绍:

代码语言:javascript复制
  A:为避免不得不检查所有引用计数可能减少的垃圾周期,这个算法把所有可能根(possible roots 都是zval变量容器),放在根缓冲区(root buffer)中(用紫色来标记,称为疑似垃圾),这样可以同时确保每个可能的垃圾根(possible garbage root)在缓冲区中只出现一次。仅仅在根缓冲区满了时,才对缓冲区内部所有不同的变量容器执行垃圾回收操作。

  B:模拟删除每个紫色变量。模拟删除时可能将不是紫色的普通变量引用数减”1”,如果某个普通变量引用计数变成0了,就对这个普通变量再做一次模拟删除。每个变量只能被模拟删除一次,模拟删除后标记为灰。

  C:模拟恢复每个紫色变量。恢复是有条件的,当变量的引用计数大于0时才对其做模拟恢复。同样每个变量只能恢复一次,恢复后标记为黑,基本就是步骤 B 的逆运算。这样剩下的一堆没能恢复的就是该删除的蓝色节点了,在步骤 D 中遍历出来真的删除掉。

算法中都是模拟删除、模拟恢复、真的删除,都使用简单的遍历即可(最典型的深搜遍历)。复杂度为执行模拟操作的节点数正相关,不只是紫色的那些疑似垃圾变量。

0 人点赞