CLB日志类型
CLB日志还有类型?当然CLB维护着千亿QPS的网关产品,精细化运营管理还是很齐全的。
- 访问日志,场景:瞅瞅这个《腾讯云CLB日志接入/分析/可视化/告警》;
- 健康检查日志,场景:RS异常/发现不及时/历史回溯等,来看看和CLS怎么玩转。
- 操作日志,场景:安全审计/核心隐患及时发现等,来看看和CLS怎么玩转。
健康检查日志
需求场景:
- 异常判断,是RS异常/还是CLB异常?这个问题经常性的出现在售后工单里,以前用户侧判断RS异常缺少有效手段,那么现在通过配置健康检查日志 To CLS可以完美解决;
- 时效性差,需要工单/服务群确认问题,影响不可控。
接入流程:
一键开启,参考配置健康检查日志。
如上选择对应CLB实例即可,开启投递,生效时间5-10分钟。
日志字段说明:
日志字段说明,参考如下:
实际到CLS检索到的日志情况如下:
可以发现,无需配置索引,即可被检索到,CLB投递日志的时候已开启索引。
CLB健康检查日志说明:
- 腾讯云CLB健康检查日志是跳变日志,即只有状态变更才会才生日志,不会持续刷日志,避免产生不必要的重复信息;
- 状态变更是指,RS状态检查正常和检查异常了;
- 每个RS异常状态变更,会产生数条探测日志(因CLB是集群,包含多台LD节点,因集群大小,产生的条数略有差异);
- 支持应用型负载均衡类型,支持TCP/UDP/http(s)监听器。
添加告警:
快速添加告警
通过CLS检索页面,输入需要的SQL语句,通过快速添加告警,即可跳转到新建告警策略页面:
代码语言:javascript复制SQL语句如:status:DEAD | select count(*) as clb_hb_lose_cnt
新建告警策略
填写告警名称/触发条件/测试监控任务(测试监控任务是CLS 2021.8月新发布功能)
选择告警频率/选择通知渠道/同时支持多维分析(多维分析是CLS 2021.08新发布功能)
其中通过多维分析,可以将告警内容丰富,如字段top,聚合某个字段当时的统计值等等。
告警时效:
如下:日志产生时间是08:48:25,到CLS的时间是08:48:32,7s左右的延迟。
告警时间如下:08:49:28被触发,56s左右延迟(因告警SQL每分钟执行1次,可能时间会更短,和告警SQL拉起时间有关)
异常复盘场景:
如查看某RS的具体异常和恢复时间点。
操作日志
需求场景:
- 及时发现线上变更(如xxx时间xxx人调整了xxx实例的权重);
- 核心变更监测(如CLB 特殊化配置);
- 审计日志,安全需求等。
接入流程:
CLB操作日志是自动上报到云审计,只需开通云审计跟踪集,投递到CLS,就可以利用CLS的检索/SQL/告警/Dashboard的能力。(目前云审计日志已支持投递CLS,提工单申请开通即可)
操作日志详情:
如下:因日志字段过多,只显示部分日志字段,如操作账号/时间/资源类型/事件名称等。
操作日志应用实践场景:
- 监测线上CLB实例RS权重被修改
对应检索语句如下:
代码语言:javascript复制resourceType:"clb" AND actionType:"Write" AND eventName:"ModifyTargetWeight"
- 监测负载均衡维度的个性化配置操作
对应检索语句如下:
代码语言:javascript复制resourceType:"clb" AND actionType:"Write" AND eventName:"SetCustomizedConfigForLoadBalancer"
- 监测非办公网IP的操作
对应的检索语句如下:
代码语言:javascript复制resourceType:"clb" AND actionType:"Write" NOT sourceIPAddress:"117.111.119.45"
event类型:
目前CLB支持近百种类型event,可以参考CLB API接口的输入参数的Action。
如下所示:
告警分析:
告警分析的能力参考如上健康检查日志/访问日志,以及最近CLS更新了N种新SQL满足不同场景。
更多好玩的/有意义的日志玩法,欢迎分享交流。