前情提要
1.基于 Kubernetes Events 的告警通知实现[1]
概述
在分析 K8S 集群问题时,Kubernetes Events 是超级有用的。
Kubernetes Events 可以被当做是日志来处理,格式也和日志很像,都包括:
1.时间
2.组件
3.原因
4....
但是,Kubernetes 默认只持久化了一个小时的事件,以减少 etcd 的负载。所以,考虑利用 Loki 存储和查询这些 Events。
实现
看过 我之前的文章[2] 的可以知道,kubernetes-event-exporter[3] 可以实现对 Kubernetes Events 的收集。
那我们就利用 kubernetes-event-exporter, 通过最简单的 stdout
方式来输出 json 格式的 event.
另外,再利用 Promtail 的 管道配置[4],将 NameSpace 作为附加标签添加到导出到 Loki 的日志中。
kubernetes-event-exporter 配置
如下:
代码语言:javascript复制logLevel: error
logFormat: json
trottlePeriod: 5
route:
routes:
- match:
- receiver: "dump"
receivers:
- name: "dump"
stdout: { }
Promtail 配置
如下:
代码语言:javascript复制...
scrape_configs:
- job_name: kubernetes-pods-app
pipeline_stages:
- cri: {}
- match:
selector: '{app="event-exporter"}'
stages:
- json:
expressions:
namespace: involvedObject.namespace
- labels:
namespace: ""
...
上面的配置会从 Events 的 JSONPath involvedObject.namespace
中获取 NameSpace ,并将其作为一个标签 - namespace
添加。
至此,我可以只查看特定 NameSpace(如emqx
) 的 Events, 如下图:
来自 emqx NameSpace 的 Events