openGauss 2.1.0 闪回特性

2021-10-15 15:04:17 浏览数 (1)

点击上方"蓝字"

关注我们,享更多干货!

openGauss 2.1.0于2021年9月30日发布,是openGauss的一个Preview版本,该版本生命周期仅为半年。该版本的新增功能如下:

  • 存储过程兼容性增强
  • SQL引擎能力增强
  • 支持Ustore存储引擎
  • 支持段页式存储
  • 基于Paxos分布式一致性协议的高可用
  • AI4DB和DB4AI竞争力持续构筑
  • 日志框架及错误码整改
  • JDBC客户端负载均衡及读写分离
  • 支持cmake脚本编译
  • 列存表支持主键唯一键约束
  • 支持jsonb数据类型
  • 支持unique sql自动淘汰
  • UCE故障感知
  • 支持GB18030字符集
  • 备机catch优化
  • 客户端工具gsql支持readline命令自动补齐
  • 动态数据脱敏• 支持国密算法
  • 防篡改账本数据库
  • 内置角色和权限管理机制
  • 透明加密
  • 全密态数据库增强
  • 支持dblink
  • 支持Ubuntu系统
  • 支持Hash索引
  • upsert支持子查询
  • min/max函数支持ip地址类型
  • 增加array_remove/array_replace/first/last函数
  • Data Studio客户端工具适配内核特性

虽然以上官方文档中描述的新增特性中并没有提及闪回特性,但在《管理员指南》中已经明确提及该特性的使用方法。

闪回恢复其实是利用回收站的闪回恢复删除的表。利用MVCC机制闪回恢复到指定时间点或者CSN点(commit sequence number)。

闪回技术能够有选择性的高效撤销一个已提交事务的影响,从人为错误中恢复。在采用闪回技术之前,只能通过备份恢复、PITR等手段找回已提交的数据库修改,恢复时长需要数分钟甚至数小时。采用闪回技术后,恢复已提交的数据库修改前的数据,只需要秒级,而且恢复时间和数据库大小无关。

闪回恢复适用于:

• 误删除表的场景;

• 需要将表中的数据恢复到指定时间点或者CSN。

闪回支持两种恢复模式:

• 基于MVCC多版本的数据恢复:适用于误删除、误更新、误插入数据的查询和恢复,用户通过配置旧版本保留时间,并执行相应的查询或恢复命令,查询或恢复到指定的时间点或CSN点。

• 基于类似windows系统回收站的恢复:适用于误DROP、误TRUNCATE的表的恢复。用户通过配置回收站开关,并执行相应的恢复命令,可以将误DROP、误TRUNCATE的表找回。

重要提示:

遗憾的是,官方文档关于闪回恢复的前提条件并没有描述到位,导致初次接触该功能的小伙伴有些茫然(我也是),无法复现闪回恢复的特性操作。这里,需要向大家明确的是:关于openGauss的闪回,仅支持Ustore存储引擎(和Oracle一样,闪回的数据存储在UNDO表空间),也就是说,我们需要创建Ustore存储引擎的表才可以使用openGauss的闪回功能。

下面我们来看看openGauss的闪回测试。

1

创建测试数据

1. 设置Ustore闪回相关参数
代码语言:javascript复制
gs_guc set -N all -I all -c "undo_zone_count=16384"           ## 内存中可分配的undo zone数量,0代表禁用undo和Ustore表,建议取值为max_connections*4
gs_guc set -N all -I all -c "enable_default_ustore_table=on"  ## 开启默认支持Ustore存储引擎
gs_guc set -N all -I all -c "version_retention_age=10000"     ## 旧版本保留的事务数,超过该事务数的旧版本将被回收清理
gs_guc set -N all -I all -c "enable_recyclebin=on"            ## 打开回收站
gs_guc set -N all -I all -c "recyclebin_retention_time=15min" ## 置回收站对象保留时间,超过该时间的回收站对象将被自动清理
gs_om -t restart
2. 创建测试表
代码语言:javascript复制
gsql -d postgres -p 26000 -r
openGauss=# create table t1(a int,b int,c int,d int);
openGauss=# insert into t1 values(1,2,3,4),(21,22,23,24),(31,32,33,34);
openGauss=# select * from t1;
 a  | b  | c  | d
---- ---- ---- ----
  1 |  2 |  3 |  4
 21 | 22 | 23 | 24
 31 | 32 | 33 | 34
openGauss=# d  t1
                          Table "public.t1"
 Column |  Type   | Modifiers | Storage | Stats target | Description
-------- --------- ----------- --------- -------------- -------------
 a      | integer |           | plain   |              |
 b      | integer |           | plain   |              |
 c      | integer |           | plain   |              |
 d      | integer |           | plain   |              |
Has OIDs: no
Options: orientation=row, compression=no, storage_type=USTORE

2

闪回查询

闪回查询可以查询过去某个时间点表的某个snapshot数据,这一特性可用于查看和逻辑重建意外删除或更改的受损数据。闪回查询基于MVCC多版本机制,通过检索查询旧版本,获取指定老版本数据。

示例:

1. 更新元组
代码语言:javascript复制
openGauss=# select current_timestamp;
       pg_systimestamp------------------------------
 2021-10-12 10:03:08.272344 08

openGauss=# update t1 set a=99;
openGauss=# select * from t1;
 a  | b  | c  | d---- ---- ---- ----
 99 |  2 |  3 |  4
 99 | 22 | 23 | 24
 99 | 32 | 33 | 34
2. 查询timestamp对应的CSN
代码语言:javascript复制
openGauss=# select snptime,snpcsn from gs_txn_snapshot 
            where snptime between '2021-10-12 10:03:05.272344 08' and '2021-10-12 10:03:18.272344 08';
            snptime            | snpcsn------------------------------- --------
 2021-10-12 10:03:07.583368 08 |   2213
 2021-10-12 10:03:10.595467 08 |   2214
 2021-10-12 10:03:13.606675 08 |   2215
 2021-10-12 10:03:16.619061 08 |   2216
3. 执行闪回查询命令,查看闪回结果
  • 基于timestamp的闪回查询
代码语言:javascript复制
select * from t1 timecapsule timestamp to_timestamp('2021-10-12 10:03:08.272344','YYYY-MM-DD HH24:MI:SS.FF');
 a  | b  | c  | d---- ---- ---- ----
  1 |  2 |  3 |  4
 21 | 22 | 23 | 24
 31 | 32 | 33 | 34
  • 基于CSN的闪回查询
代码语言:javascript复制
select * from t1 timecapsule csn 2213;
 a  | b  | c  | d---- ---- ---- ----
  1 |  2 |  3 |  4
 21 | 22 | 23 | 24
 31 | 32 | 33 | 34

说明:

• TIMESTAMP参数:指要查询某个表在TIMESTAMP这个时间点上的数据,TIMESTAMP指一个具体的历史时间。

• CSN参数:CSN是一个逻辑提交时间点,数据库中的CSN是一个写一致性点,查询某个CSN下的数据代表SQL查询数据库在该一致性点的相关数据。

3

回收站

在拥有回收站之前,当用户误将表drop或truncate后,只能使用全库备份恢复的方式来解决这种逻辑错误。

在openGauss 2.1.0版本中,引入了回收站功能,用户通过该功能可以从回收站中闪回TRUNCATE或DROP的表对象,将数据恢复到错误操作前,大大提高了用户数据的可靠性。

闪回drop: 可以恢复意外删除的表,从回收站(recyclebin)中恢复被删除的表及其附属结构如索引、表约束等。闪回drop是基于回收站机制,通过还原回收站中记录的表的物理文件,实现已drop表的恢复。

闪回truncate: 可以恢复误操作或意外被进行truncate的表,从回收站中恢复被truncate的表及索引的物理数据。闪回truncate基于回收站机制,通过还原回收站中记录的表的物理文件,实现已truncate表的恢复。

官方文档没有强调到的坑需要注意:recyclebin不支持Ustore,只支持Astore[详见下面测试示例] – 需要找开发确认,更新官方文档

示例:

1. 误操作删除表
代码语言:javascript复制
-- 创建测试数据
openGauss=# create table t1(id int,name varchar(200)) with (STORAGE_TYPE=USTORE);
openGauss=# insert into t1 values(1,'t1_Tom'),(2,'t1_Jerry');
openGauss=# select * from t1;
 id |   name
---- ----------
  1 | t1_Tom
  2 | t1_Jerry
openGauss=# create table t2(id int,name varchar(200)) with (STORAGE_TYPE=ASTORE);
openGauss=# insert into t2 values(1,'t2_Tom'),(2,'t2_Jerry');
openGauss=# select * from t2;
 id |   name
---- ----------
  1 | t2_Tom
  2 | t2_Jerry
-- 模拟误删表
openGauss=# drop table t1;
openGauss=# drop table t2;
2. 查询回收站对象
代码语言:javascript复制
openGauss=# SELECT rcyname,rcyoriginname,rcytablespace FROM GS_RECYCLEBIN;
           rcyname           | rcyoriginname | rcytablespace
----------------------------- --------------- ---------------
 BIN$3BFF4EB403B$4C71318==$0 | t2            |             0   -- 仅看见Astore存储的t2表,并没有看到Ustore存储的t1表,注意!!
(1 row)
3. 闪回操作
代码语言:javascript复制
openGauss=# timecapsule table t2 to before drop rename to t2_bak;
TimeCapsule Table
openGauss=# select * from t2_bak;
 id |   name
---- ----------
  1 | t2_Tom
  2 | t2_Jerry

和Oracle一样,也可以使用recyname恢复表,如“timecapsule table “BIN3BFF4EB403B4C71318==

其他闪回操作详见官方文档。

4. 清空回收站
代码语言:javascript复制
openGauss=# purge recyclebin;
PURGE RECYCLEBIN

以上是本人对openGauss 2.1.0版本闪回特性的基本测试,希望能帮助到有需要的小伙伴。

0 人点赞