摘自 Kubernetes 实践指南
概述
Grafana 默认安装是单副本,非高可用部署,而 Grafana 自身是支持多副本高可用部署的,本文介绍其配置方法以及已经安装的 Grafana 如何迁移到高可用架构。
修改配置
要让 Grafana 支持高可用,需要对 Grafana 配置文件 (grafana.ini
) 进行一些关键的修改:
- Grafana 默认使用 sqlite3 文件存储数据,多副本共享可能会有数据冲突,可以配置一下
database
让多副本共享同一个 mysql 或 postgres 数据库,这样多副本就可以无状态横向伸缩。 - Grafana 多副本运行,如果配置了告警规则,每个副本都会重复告警,配置一下
ha_peers
让 Grafana 自行选主只让其中一个副本执行告警。
[database]
url = mysql://root:123456@mysql.db.svc.cluster.local:3306/grafana
[unified_alerting]
enabled = true
ha_peers = monitoring-grafana-headless.svc.monitoring.cluster.local:9094
[alerting]
enabled = false
database
下配置数据库连接信息,包含数据库类型、用户名、密码、数据库地址、端口以及要具体哪个库。alerting
的enabled
置为 false,表示禁用默认的告警方式(每个 Grafana 实例都单独告警)。unified_alerting
的enabled
置为 true,表示开启高可用告警。unified_alerting
的ha_peers
填入 Grafana 所有实例的地址,在 k8s 环境可用 headless service,dns 会自动解析到所有 pod ip 来实现自动发现 Grafana 所有 IP,端口默认是 9094,用于 gossip 协议实现高可用。
helm chart 配置示例
如果 grafana 安装到 Kubernetes,通常使用 helm chart 来安装,一般是 grafana 官方 chart,values.yaml
配置示例:
replicas: 2
defaultDashboardsTimezone: browser
grafana.ini:
unified_alerting:
enabled: true
ha_peers: 'monitoring-grafana-headless.monitoring.svc.cluster.local:9094'
alerting:
enabled: false
database:
url: 'mysql://root:123456@mysql.db.svc.cluster.local:3306/grafana'
server:
root_url: "https://grafana.imroc.cc"
paths:
data: /var/lib/grafana/
logs: /var/log/grafana
plugins: /var/lib/grafana/plugins
provisioning: /etc/grafana/provisioning
analytics:
check_for_updates: true
log:
mode: console
grafana_net:
url: https://grafana.net
grafana.ini
字段用于修改 grafana 配置文件内容,使用yaml
格式定义,会自动转成ini
。ha_peers
指向的 headless service 自行提前创建(当前 chart 内置的 headless 没暴露 9094 端口)。
headless service 示例:
代码语言:yaml复制apiVersion: v1
kind: Service
metadata:
name: monitoring-grafana-headless
namespace: monitoring
spec:
clusterIP: None
ports:
- name: http-web
port: 3000
protocol: TCP
targetPort: 3000
- name: alert
port: 9094
protocol: TCP
targetPort: 9094
selector:
app.kubernetes.io/instance: monitoring
app.kubernetes.io/name: grafana
type: ClusterIP
如果你使用的 kube-prometheus-stack 安装,实际也是用的 Grafana 官方的 chart,只不过作为了一个子 chart,写 values.yaml
时将上面准备的配置放到 grafana
字段下面即可:
grafana:
replicas: 2
defaultDashboardsTimezone: browser
grafana.ini:
...
已安装的 Grafana 如何迁移到高可用架构 ?
如果你用的默认安装,使用 sqlite3 文件存储数据,可以先按照如下步骤迁移数据:
- 拿到
grafana.db
文件,使用 Grafana 官方提供的迁移脚本 sqlitedump.sh 将 sqlite3 的数据转换成 sql 文件:
sqlitedump.sh grafana.db > grafana.sql
确保环境中安装了 sqlite3 命令。
- 停止 Grafana (如果是 K8S 部署,可以修改副本数为 0)。
- 准备好数据库,提前创建好 grafana database:
CREATE DATABASE grafana
- 替换 Grafana 配置文件,参考前面的配置示例。
- 启动 Grafana,让 Grafana 自动初始化数据库。
- 将 sql 文件导入数据库执行:
mysql -h172.16.181.186 -P3306 -uroot -p123456 grafana < grafana.sql
- 恢复 Grafana 运行。
参考资料
- Set up Grafana for high availability