阅读(553) (0)

PostgreSQL 通用WAL 记录

2021-08-24 10:47:25 更新

虽然所有内建的被 WAL 记录的模块都有它们自己的 WAL 记录类型,系统中也还是有一种通用 WAL 记录类型,它以一种通用的方式描述了对页面的改变。这对于提供自定义访问方法的扩展有用,因为这类扩展无法注册自己的 WAL 重做例程。

构建通用 WAL 记录的 API 定义在access/generic_xlog.h中,实现在access/transam/generic_xlog.c中。

要使用通用 WAL 记录工具执行一次被 WAL 记录的数据更新,要遵循这些步骤:

  1. state = GenericXLogStart(relation) — 为给定的关系构建一个通用 WAL 记录。

  2. page = GenericXLogRegisterBuffer(state, buffer, flags) — 注册一个要在当前的通用 WAL 记录中修改的缓冲区。这个函数会返回一个指针指向该缓冲区页面的一份临时拷贝,修改将会在该拷贝上进行(不要直接修改该缓冲区的内容)。第三个参数是适用于该操作的标志的位掩码。当前这类标志只有GENERIC_XLOG_FULL_IMAGE,它表示在 WAL 记录中应该包括一个完整页面镜像而不是增量更新。如果是新页面或者页面已经被完全重写,通常会设置这个标志。如果被 WAL 记录的动作需要修改多个页面,可以反复调用GenericXLogRegisterBuffer

  3. 对包含在上一步中的页面镜像应用修改。

  4. GenericXLogFinish(state) — 将更改应用到缓冲区并且发出通用 WAL 记录。

在上述步骤之间都可以调用GenericXLogAbort(state)取消 WAL 记录构造。这会丢弃所有对于页面镜像拷贝的更改。

在使用通用 WAL 记录功能时请注意以下几点:

  • 不允许直接修改缓冲区!所有的修改必须在GenericXLogRegisterBuffer()取得的拷贝上完成。换句话说,制造通用 WAL 记录的代码不能为自己调用BufferGetPage()。不过,在合适的时间对缓冲区进行 pin/unpin 以及加锁/解锁仍然是调用者的责任。从GenericXLogRegisterBuffer()之前直到 GenericXLogFinish()之后,每个目标上必须保持排他锁。

  • 可以自由地混合注册缓冲区(步骤 2)和页面镜像修改(步骤 3),即两个步骤可以以任何顺序重复。记住注册缓冲区的顺序应该和重放时对它们加锁的顺序相同。

  • 一个通用 WAL 记录能注册的缓冲区最大数量是MAX_GENERIC_XLOG_PAGES。如果超出这个限制将会抛出一个错误。

  • 通用 WAL 假定要被修改的页面具有标准布局,特别是在pd_lowerpd_upper之间没有有用的数据。

  • 由于正在修改缓冲区页面的拷贝,GenericXLogStart()不会开始临界区。因此可以在GenericXLogStart()之间GenericXLogFinish()安全地进行内存分配、抛出错误等。唯一真正的临界区存在于GenericXLogFinish()内。还有,不需要担心在错误退出期间对 GenericXLogAbort()的调用。

  • GenericXLogFinish()会负责标记缓冲区为脏并且设置它们的 LSN。你不需要显式地做这些工作。

  • 对于不做日志的关系,所有的事情都一样,不过不会发出实际的 WAL 记录。因此,对于不做日志的关系你通常不需要做任何显式的检查。

  • 通用 WAL 重做函数将按照注册缓冲区的顺序对它们获得排他锁。在重做所有更改后,这些锁将按照同样的顺序被释放。

  • 如果对一个已注册的缓冲区没有指定GENERIC_XLOG_FULL_IMAGE,通用 WAL 记录包含了新旧页面镜像之间的不同。这个不同是以逐字节比较的方式形成的。对于在页面内移动数据的情况来说这种方式不是很紧凑,未来可能会有改进。