接上期,上期大致比对了一下基本的指标,本期就的详细的比对一下两个高可用软件的信息的功能了。
以上信息展开来看
序号 | 详细指标 | 指标对象 |
---|---|---|
1 | 清理postgresql 进程,系统可被拉起使系统正常 | 针对高可用 standby对象 |
2 | 手动停止postgres 进程,系统被拉起进行工作 | 针对高可用 standby对象 |
3 | 重新启动postgresql, 自动拉起postgresql服务 | 针对高可用 standby对象 |
4 | 关闭patroni 服务 或 关闭 rpemgrd 服务 | 针对高可用 standby对象 |
5 | 清理postgresql 进程,系统可被拉起使系统正常 | 针对高可用 master对象 |
6 | 手动停止postgres进程 | 针对高可用 master对象 |
7 | 重新启动服务器 | 针对高可用 master对象 |
8 | 停止patroni 进程 或 停止repmgr 进程 | 针对高可用进程 |
以上的8个点分别针对两种高可用方式中的 主节点 和 从节点 以及高可用服务本身。
Patroni | Repmgr |
---|---|
可以 | 功能不满足 |
可以 | 功能不满足 |
默认重启服务器也强制拉起数据库 | 不会强制拉起postgresql 数据库服务 |
相关命令失效,数据库服务不在被监管 | 基本服务政策,故障切换功能停止 |
直接拉起服务,写入会有停顿 | 启动提升从库的策略,从库升为主库,切换中有写入停顿 |
直接拉起服务,写入会有停顿 | 启动提升从库的策略,从库升为主库,切换中有写入停顿 |
主从节点开始切换,重启服务器变为从节点加入到原集群 | 主从节点开始切换,重启服务器变为从节点加入到原集群 |
产生双主,产生新主,旧主同时工作 | 主不能被切换 |
从以上几点来分析, Patroni 明显在数据库服务停止时,及时的拉起postgres的数据库服务, 这点对比repmgr 明显是有优势的。对于一些由于服务进程本身停止或退出的情况可以立即的进行补救,避免切换的动作。而反观repmgr 本身基于监控postgres主进程的状态,如果进程停止,必然会触发切换的动作。
另从主节点切换后,都提供基于PG_REWIND基础的,节点回归方式,这点是二者相同的。
但Patroni 有一个问题,就是在patroni 服务本身失效的情况下,有可能会产生双主的问题,而更糟糕的是在patroni 在旧主节点再次生效下,一些在双主时期写入旧主的数据会通过pg_rewind 被抹除掉,造成数据丢失。这点是一个硬伤,所以在使用patroni的时候,必须对patroni 服务本身进行严格的监控,同时必须配置一个靠谱的 VIP 服务及时切换,让应用写入新主。这个问题就基本上避免了。
从网络的角度,9和10两点针对网络的抖动和不稳定对于数据库高可用本身也是一种挑战,假设主节点和从节点网络突发出现问题,patroni 和 repmgr 两者本身对网络问题是如何进行应对的。
从最上面的图看,patroni 在面对网络的抖动的方面要强于 repmgr, 这主要也是基于二者的高可用架构的不同,patroni 本身是建立在raft 协议,或者paxos 协议上的一个模板,(具体是raft 还是 paxos 看你使用的分布式存储系统),这就奠定了patroni本身具备网络故障时进行问题粗粒的优势, 反观repmgr 本身是基于类似双机热备,模式,让他对网络的抖动进行快速的处理这在设计中就是劣势,加入monitor wintness 节点后会提高repmgr抵御网络问题的能力。
从第一期到本期,最终我们总结一下二者的优缺点
REPMGR 优点
Regmgr 提供了一套可以直接进行主从配置的程序,在部署repmgr本身就可以制作一套主从复制的节点,并且添加节点也比较容易。
本身安装简单,不使用任何额外的网络端口,通过SSH 本身进行相关的高可用工作支持。
提供用户注册的方式对集群中的节点进行前期的设置,可以方便的设置针对切换的敏感程度。
Patroni 优点
Patroni 启用的是一个端到端的服务支持REST APIS 对于二次开发是友好的,基于DSC 的概念,是一款具有分布式理念的高可用软件。针对网络问题可以较好的处理高可用切换。
REPMGR 问题:
REPMGR 针对postgresql的配置本身不会检测 standby 从库的问题,如果在切换过程中,发现主从库的配置不一,导致切换后出现问题,这需要DBA 本身对工作的细致以及责任。
本身基于服务本身状态提供和发现,不基于分布式协议。
切换后的注册信息,需要手工去处理。
Patroni 问题:
Patroni 本身是不会检测复制连接的状态,当主从的复制不工作的情况下,此节点还是会被展示成一个从库, 同时patroni的安装一直是一个比较复杂的问题,需要选择一款 DCS软件并且对此软件的工作原理和操作有比较深的使用知识。需要设置多个端口来提供相关的服务,并且如果遇到服务器出现性能超负荷的情况下,分布式软件的部署的位置有可能会影响本身Patroni 判断和工作的状态。
总结:两款产品都有自己的特点和优势,也都有自己的问题点,熟悉自己工作环境中的问题点(如主机稳定不高或网络不稳定),针对高可用中的某些服务建立有效监控,调整参数,甚至进行二次开发,降低高可用配置的难度与结构的复杂性,选择好基于postgresql 的一款好用的高可用软件。