0626-如何监控OpenLDAP主主同步状态

2019-05-16 11:23:56 浏览数 (2)

温馨提示:如果使用电脑查看图片不清晰,可以使用手机打开文章单击文中的图片放大查看高清原图。

Fayson的github: https://github.com/fayson/cdhproject

提示:代码块部分可以左右滑动查看噢

1

文档编写目的

本篇主要介绍在OpenLDAP在实现主主同步后,如何监控服务之间主主同步状态,通过监控及时发现主主同步失败问题。

  • 测试环境

1.Redhat7.5

2.OpenLDAP版本为2.4.44

  • 前置条件

1.OpenLDAP已实现主主同步

2

环境说明

1.OPenLDAP已实现了主主同步

代码语言:javascript复制
[root@cdh01 ~]# ldapsearch -h cdh01.fayson.net -b "dc=fayson,dc=net" -D "cn=Manager,dc=fayson,dc=net" -W |grep dn

为了能够达到OPenLDAP主主同步状态监控的目的,经过查询找到一些资料找到了关于OpenLDAP管理的一些小工具可以参考如下网址:https://ltb-project.org/start,该工具提供了基于Nagios Plugins的perl监控脚本。

3

监控脚本使用

1.监控脚本依赖Nagios Plugins插件,需要在服务器上安装依赖,命令如下:

代码语言:javascript复制
[root@cdh03 ~]# yum -y install nagios-plugins-perl perl-Time-Piece perl-LDAP

2.下载监控脚本,地址如下:

代码语言:javascript复制
https://ltb-project.org/archives/ltb-project-nagios-plugins-0.7.tar.gz

3.解压ltb-project-nagios-plugins-0.7.tar.gz包

代码语言:javascript复制
[root@cdh03 ~]# tar -zxf ltb-project-nagios-plugins-0.7.tar.gz  
[root@cdh03 ~]# ll ltb-project-nagios-plugins-0.7

上述压缩包中提供了多个监控脚本,这里Fayson主要介绍check_ldap_syncrepl_status.pl脚本,该脚本主要是用于监控OpenLDAP同步状态。

4.check_ldap_syncrepl_status.pl脚本参数说明

Mandatory options参数说明:

-H: 指定slave节点的IP或hostname

-w: 指同步延迟超过多少秒警告

-c: 指同步延迟超过多少秒严重警告

Other options参数说明:

-v,-vv,-vvv:指定debug级别

-V: 输出脚本版本并退出

-h: 输出脚本的帮助说明并退出

-p: slave服务的端口号

-f: 输出deltatime数据

-U: LDAP Master的URI地址(ldap://cdh01.fayson.net)

-I: OpenLDAP主从同步时配置的rid,rid与-U参数的Master一致

脚本使用:

代码语言:javascript复制
[root@cdh03 ltb-project-nagios-plugins-0.7]# ./check_ldap_syncrepl_status.pl -H cdh01.fayson.net -w 120 -c 120 -U ldap://cdh02.fayson.net -I 002

4

同步状态监控验证

本章节主要通过启用开启Slave节点的Firewall来模拟两个LDAP服务之间主主同步失败现象,然后通过check_ldap_syncrepl_status.pl脚本能够监控到主主同步失败问题。

1.启动cdh02.fayson.net节点的防火墙

代码语言:javascript复制
[root@cdh02 sync]# systemctl start firewalld
[root@cdh02 sync]# systemctl status firewalld

2.在master节点上执行ldapdelte操作,删除fayson用户和组

代码语言:javascript复制
[root@cdh01 ~]# ldapdelete -x -D "cn=Manager,dc=fayson,dc=net" -W "uid=fayson,ou=People,dc=fayson,dc=net"
[root@cdh01 ~]# ldapdelete -x -D "cn=Manager,dc=fayson,dc=net" -W "cn=fayson,ou=Group,dc=fayson,dc=net"
[root@cdh01 ~]# ldapsearch -h cdh01.fayson.net -b "dc=fayson,dc=net" -D "cn=Manager,dc=fayson,dc=net" -W |grep dn

此时的Slave节点fayson用户和组并未同步删除

3.上面模拟了主主同步状态异常后,关闭Slave节点的防火墙执行监控脚本检查同步状态

代码语言:javascript复制
./check_ldap_syncrepl_status.pl -H cdh02.fayson.net -w 120 -c 120 -U ldap://cdh01.fayson.net -I 001
./check_ldap_syncrepl_status.pl -H cdh01.fayson.net -w 120 -c 120 -U ldap://cdh02.fayson.net -I 002

通过上述截图可以看到slave(cdh02)节点与master(cdh01)节点同步失败并输出严重告警“CRITICAL - directories are not in sync - 205 seconds late”,与模拟的同步失败一致并通过脚本监控到同步失败状态。

5

总结

1.可以通过脚本的-c和-w参数指定延迟同步时间,通过设置的延迟时间阈值产生不同级别的告警。

2.OpenLDAP配置的主主同步,在文章中使用两个脚本分别监控两侧LDAP同步情况。

提示:代码块部分可以左右滑动查看噢

为天地立心,为生民立命,为往圣继绝学,为万世开太平。 温馨提示:如果使用电脑查看图片不清晰,可以使用手机打开文章单击文中的图片放大查看高清原图。

0 人点赞