EventBridge 最佳实践场景二:使用 EventBridge + SCF 实现服务器异常的自动回滚

2021-12-18 00:40:37 浏览数 (1)

01.

背景介绍

对于企业的生产环境而言,监控与报警不可或缺的,完善的监控与及时的报警和自动化处理,可以帮助企业快速定位并解决问题,从而减少经济损失。

腾讯云事件总线(EventBridge)是一款安全、稳定、高效的无服务器事件管理平台。事件中心的事件总线可以接收来自您自己的应用程序、软件即服务(SaaS)和腾讯云服务的实时事件及相关数据流,通过集成消息推送和 SCF 云函数,实现告警信息的实时通知和自动化处理。

本文以服务器异常为例,为您介绍当云服务器产生告警事件后,如何基于 EventBridge 事件总线和 SCF 云函数,实现告警消息的实时推送和硬盘快照的自动回滚,完成自动化运维架构的快速搭建。

02.

背景介绍

整体架构设计如图,从图上可以看出,当云服务器某台机器出现异常告警, CVM 会自动产生告警事件并主动推送给 EB,经过 EB 绑定的告警规则筛选后,完成到通知渠道的消息触达及时通知到用户,同时触发云函数,以调用 API 的方式完成硬盘快照的快速回滚,保证业务及时恢复。

03.

基本步骤

1. 登录云函数控制台新建云函数,通过调用 API 的方式,完成服务器故障后自动处理流程的函数代码编写

  • 云函数控制台:https://console.cloud.tencent.com/scf
  • 云服务器关机接口:https://cloud.tencent.com/document/product/213/15743
  • 快照回滚接口:https://cloud.tencent.com/document/product/362/15643

2. 登录 EventBridge 控制台,配置告警规则;

  • EventBridge 控制台:https://console.cloud.tencent.com/eb

3. 以「云服务器运行异常」事件告警配置为例,您可以选择指定的事件告警类型,也可以选择全部告警事件,详细事件匹配规则请参见 管理事件规则;

  • 管理事件规则:https://cloud.tencent.com/document/product/1359/56084

4. 配置推送目标

为了满足自动化处理和消息推送两部分能力,对于上述规则,我们需要同时配置消息推送和云函数两个投递目标

  • 消息推送:通过配置消息推送,将您的告警事件推送至指定的消息接收渠道,完成用户及时触达。
  • 云函数投递:触发方式选择「云函数(SCF)」--「已有函数」,选择刚刚已部署好的云函数进行绑定

5. 告警链路测试

配置完成后,回到事件集控制台,选择刚刚已绑定的事件集,单击发送事件,可以选择已绑定的事件规则模版,单击发送进行测试,如果同时收到了推送消息并自动进行回滚,即可确认您的业务故障自动化运维架构已完成搭建。

注:测试模版里只展示 data 字段里的内容,其它字段已固定,无法自定义修改。


识别下方

0 人点赞