构建企业级监控平台系列(二十一):Prometheus Pushgateway 详解

2023-10-27 15:48:42 浏览数 (1)

Pushgateway 介绍

Pushgateway为Prometheus整体监控方案的功能组件之一,并做为一个独立的工具存在。它主要用于Prometheus无法直接拿到监控指标的场景,如监控源位于防火墙之后,Prometheus无法穿透防火墙;目标服务没有可抓取监控数据的端点等多种情况。在类似场景中,可通过部署Pushgateway的方式解决问题。

当部署该组件后,监控源通过主动发送监控数据到Pushgateway,再由Prometheus定时获取信息,实现资源的状态监控。

更多关于企业级监控平台系列的学习文章,请参阅:构建企业级监控平台,本系列持续更新中。

工作流程
  • 监控源通过Post方式,发送数据到Pushgateway,路径为/metrics。
  • Prometheus服务端设置任务,定时获取Pushgateway上面的监控指标。
  • Prometheus获取监控指标后,会根据告警规则进行计算,如果匹配将触发告警到Alertmanager;同时,Grafana可配置数据源调用Prometheus数据,做为数据展示。

Pushgateway 优缺点介绍

Pushgateway优点
  • Prometheus 默认采用定时pull 模式拉取targets数据,但是如果不在一个子网或者防火墙,prometheus就拉取不到targets数据(普罗米修斯和target不在一个网段,那么是拉取不到的),所以可以采用各个target往pushgateway上push数据,然后prometheus去pushgateway上定时pull数据。
  • 在监控业务数据的时候,需要将不同数据汇总, 汇总之后的数据可以由pushgateway统一收集,然后由 Prometheus 统一拉取。

解决不在同一网段的问题,pushgateway就相当于一个中间网关。相当于pushgateway要和target可以通同时和普罗米修斯也可以通。

Pushgateway 缺点
  • Prometheus拉取状态只针对 pushgateway, 不能对每个节点都有效;
  • Pushgateway出现问题,整个采集到的数据都会出现问题
  • 监控下线,prometheus还会拉取到旧的监控数据,需要手动清理 pushgateway不要的数据。

Pushgateway 安装部署

下载安装包

代码语言:javascript复制
wget  https://github.com/prometheus/pushgateway/releases/download/v1.5.1/pushgateway-1.5.1.linux-amd64.tar.gz
tar xvf pushgateway-1.5.1.linux-amd64.tar.gz
pushgateway-1.5.1.linux-amd64/pushgateway /usr/bin/
pushgateway -h #查看帮助

准备service文件

代码语言:javascript复制
root@prometheus-server-01:~# cat /lib/systemd/system/pushgateway.service
[Unit]
Description=Prometheus Pushgateway
After=network.target

[Service]
Type=simple
User=root
Group=root
ExecStart=pushgateway --web.listen-address=:9091
Restart=on-failure

[Install]
WantedBy=multi-user.target

启动服务

代码语言:javascript复制
systemctl daemon-reload
systemctl start pushgateway
systemctl status pushgateway
systemctl enable pushgateway

访问pushgateway界面

更多关于企业级监控平台系列的学习文章,请参阅:构建企业级监控平台,本系列持续更新中。

配置Prometheus抓取数据

在prometheus配置中添加job,抓取pushgateway数据,内容如下:

代码语言:javascript复制
- job_name: pushgateway
  honor_labels: true
  static_configs:
    - targets: ["192.168.122.21:9091"]

配置修改完成后重启Prometheus。然后在Prometheus界面查看target状态

测试

要推送数据到Pushgateway中,可以其提供的API接口来添加,默认URL地址为http://<ip>:9091/metrics/job/<job-name>/<label-name>/<label-value> 其中job-name是必填项,是job标签的值,后边可以跟任意数量的标签&标签值对,一般会添加一个instance/<instance-name>标签来区分指标数据来源

测试向Pushgateway推送单条数据

执行如下命令进行单条数据推送

代码语言:javascript复制
#my_metric表示指标名称,2022表示指标值
echo "my_metric 2022"| curl --data-binary @- http://192.168.122.21:9091/metrics/job/test-job/instance/192.168.122.22
#再执行一次推送,将值改为2023
echo "my_metric 2023"| curl --data-binary @- http://192.168.122.21:9091/metrics/job/test-job/instance/192.168.122.22

在Pushgateway界面查看数据,如下图,可以看到只显示了最新值。

在Prometheus中查询my_metric,验证是否获取到数据。

测试向Pushgateway推送多条数据
代码语言:javascript复制
cat <<EOF | curl --data-binary @- http://192.168.122.21:9091/metrics/job/test-job/instance/192.168.122.22
#TYPE node_memory_total gauge
node_memory_total 10240000000
#TYPE node_memory_usage gauge
node_memory_usuge 1024000000
EOF

在Pushgateway界面查看数据

在Prometheus中查询,验证是否获取到数据

测试删除数据
代码语言:javascript复制
curl -X DELETE  http://192.168.122.21:9091/metrics/job/test-job/instance/192.168.122.22

在Pushgateway界面验证

注意事项

通过Pushgateway方式,Prometheus无法直接检测到监控源服务的状态,故此种方式不适用于监控服务的存活状态等场景。

Pushgateway属于静态代理,它接收的指标不存在过期时间,故会一直保留直到该指标被更新或删除。此种情况下,不再使用的指标可能存在于网关中。

如上所言,Pushgateway并不算是完美的解决方案,在监控中更多做为辅助方案存在,用于解决Prometheus无法直接获取数据的场景。

更多关于企业级监控平台系列的学习文章,请参阅:构建企业级监控平台,本系列持续更新中。

参考链接:https://blog.csdn.net/weixin_43266367/ article/details/129128527

0 人点赞