Pushgateway 介绍
Pushgateway为Prometheus整体监控方案的功能组件之一,并做为一个独立的工具存在。它主要用于Prometheus无法直接拿到监控指标的场景,如监控源位于防火墙之后,Prometheus无法穿透防火墙;目标服务没有可抓取监控数据的端点等多种情况。在类似场景中,可通过部署Pushgateway的方式解决问题。
当部署该组件后,监控源通过主动发送监控数据到Pushgateway,再由Prometheus定时获取信息,实现资源的状态监控。
更多关于企业级监控平台系列的学习文章,请参阅:构建企业级监控平台,本系列持续更新中。
工作流程
- 监控源通过Post方式,发送数据到Pushgateway,路径为/metrics。
- Prometheus服务端设置任务,定时获取Pushgateway上面的监控指标。
- Prometheus获取监控指标后,会根据告警规则进行计算,如果匹配将触发告警到Alertmanager;同时,Grafana可配置数据源调用Prometheus数据,做为数据展示。
Pushgateway 优缺点介绍
Pushgateway优点
- Prometheus 默认采用定时pull 模式拉取targets数据,但是如果不在一个子网或者防火墙,prometheus就拉取不到targets数据(普罗米修斯和target不在一个网段,那么是拉取不到的),所以可以采用各个target往pushgateway上push数据,然后prometheus去pushgateway上定时pull数据。
- 在监控业务数据的时候,需要将不同数据汇总, 汇总之后的数据可以由pushgateway统一收集,然后由 Prometheus 统一拉取。
解决不在同一网段的问题,pushgateway就相当于一个中间网关。相当于pushgateway要和target可以通同时和普罗米修斯也可以通。
Pushgateway 缺点
- Prometheus拉取状态只针对 pushgateway, 不能对每个节点都有效;
- Pushgateway出现问题,整个采集到的数据都会出现问题
- 监控下线,prometheus还会拉取到旧的监控数据,需要手动清理 pushgateway不要的数据。
Pushgateway 安装部署
下载安装包
代码语言:javascript复制wget https://github.com/prometheus/pushgateway/releases/download/v1.5.1/pushgateway-1.5.1.linux-amd64.tar.gz
tar xvf pushgateway-1.5.1.linux-amd64.tar.gz
pushgateway-1.5.1.linux-amd64/pushgateway /usr/bin/
pushgateway -h #查看帮助
准备service文件
代码语言:javascript复制root@prometheus-server-01:~# cat /lib/systemd/system/pushgateway.service
[Unit]
Description=Prometheus Pushgateway
After=network.target
[Service]
Type=simple
User=root
Group=root
ExecStart=pushgateway --web.listen-address=:9091
Restart=on-failure
[Install]
WantedBy=multi-user.target
启动服务
代码语言:javascript复制systemctl daemon-reload
systemctl start pushgateway
systemctl status pushgateway
systemctl enable pushgateway
访问pushgateway界面
更多关于企业级监控平台系列的学习文章,请参阅:构建企业级监控平台,本系列持续更新中。
配置Prometheus抓取数据
在prometheus配置中添加job,抓取pushgateway数据,内容如下:
代码语言:javascript复制- job_name: pushgateway
honor_labels: true
static_configs:
- targets: ["192.168.122.21:9091"]
配置修改完成后重启Prometheus。然后在Prometheus界面查看target状态
测试
要推送数据到Pushgateway中,可以其提供的API接口来添加,默认URL地址为http://<ip>:9091/metrics/job/<job-name>/<label-name>/<label-value>
其中job-name是必填项,是job标签的值,后边可以跟任意数量的标签&标签值对,一般会添加一个instance/<instance-name>
标签来区分指标数据来源
测试向Pushgateway推送单条数据
执行如下命令进行单条数据推送
代码语言:javascript复制#my_metric表示指标名称,2022表示指标值
echo "my_metric 2022"| curl --data-binary @- http://192.168.122.21:9091/metrics/job/test-job/instance/192.168.122.22
#再执行一次推送,将值改为2023
echo "my_metric 2023"| curl --data-binary @- http://192.168.122.21:9091/metrics/job/test-job/instance/192.168.122.22
在Pushgateway界面查看数据,如下图,可以看到只显示了最新值。
在Prometheus中查询my_metric,验证是否获取到数据。
测试向Pushgateway推送多条数据
代码语言:javascript复制cat <<EOF | curl --data-binary @- http://192.168.122.21:9091/metrics/job/test-job/instance/192.168.122.22
#TYPE node_memory_total gauge
node_memory_total 10240000000
#TYPE node_memory_usage gauge
node_memory_usuge 1024000000
EOF
在Pushgateway界面查看数据
在Prometheus中查询,验证是否获取到数据
测试删除数据
代码语言:javascript复制curl -X DELETE http://192.168.122.21:9091/metrics/job/test-job/instance/192.168.122.22
在Pushgateway界面验证
注意事项
通过Pushgateway方式,Prometheus无法直接检测到监控源服务的状态,故此种方式不适用于监控服务的存活状态等场景。
Pushgateway属于静态代理,它接收的指标不存在过期时间,故会一直保留直到该指标被更新或删除。此种情况下,不再使用的指标可能存在于网关中。
如上所言,Pushgateway并不算是完美的解决方案,在监控中更多做为辅助方案存在,用于解决Prometheus无法直接获取数据的场景。
更多关于企业级监控平台系列的学习文章,请参阅:构建企业级监控平台,本系列持续更新中。
参考链接:https://blog.csdn.net/weixin_43266367/ article/details/129128527