作者:唐辉
1
文档说明
当集群中的服务有故障时,CM的界面上可以直接显示告警,你也可以通过CM的API去获取这些信息,本篇文章主要介绍CM的界面告警事件以及如何使用CM提供的API获取集群的告警信息
- 内容概述
1.文档说明
2.告警介绍
3.事件告警REST API
- 测试环境
1.CM和CDH版本为CDH 5.16.1
2.操作系统版本为RedHat 7.2
2
告警介绍
在Cloudera Manager (以下简称CM)的管理界面有提供快速查看到页面的告警信息, CM中的告警信息的展示是由Event Server服务(负责检查和收集事件信息)和Alert Publisher服务(推送告警信息)所组成。告警又分为下面几种类型:
红色感叹号表示故障,需要立即处理,否则会影响正常使用
黄色感叹号表示预警,需要查看,表示可能将会出现故障,但不影响使用
红色的设置符号表示错误配置,需要立即处理,否则会影响正常使用
黄色的设置符号表示非推荐配置,需要查看并根据实际情况调整,但不影响使用
集群事件可以在CM界面>诊断>事件 查看到,如下:
CM界面上的事件分为三个级别:
CRITICAL:对应CM界面的红色感叹号告警或者对应ERROR级别的日志告警
IMPORTANT:对应CM中的黄色感叹号告警或者对应WARN级别的日志告警
INFORMATIONAL:主要是一些CM界面登录信息和集群健康检查信息
3
事件告警REST API
在CM界面上绝大部分的操作都是有对应的REST API,事件告警信息当然也不例外。API可以点击CM界面>支持>API文档获取,如下:
在API界面搜索events
点击events,查看API 说明,其中包括参数和返回值
点击查看所有事件:
浏览器输入:http://cmhost:7180/api/v19/events
或者点击上面的Mount Point :/api/v19/events
具体参数如何使用,参考下面Fayson列举几个常见的示例
对危急事件进行筛选:
http://cdh4.macro.com:7180/api/v19/events?query=severity==critical
对Hive 的危急事件进行筛选
http://cdh4.macro.com:7180/api/v19/events?query=severity==critical;attributes.service==hive
对Hive 的危急事件进行时间段筛选
http://cdh4.macro.com:7180/api/v19/events?query=severity==critical;attributes.service==hive;timeReceived=ge=2019-03-29T07:34:42.889Z;timeReceived=lt=2019-03-29T07:34:43.149Z
同样可通过事件的ID来查看某一个事件的详细信息,如下:
对应API为:/events/{eventId}
http://cdh4.macro.com:7180/api/v19/events/60f4b4fb-db98-495b-a6a7-db1f10a0fa04