最新 最热

故障排除的思路及见解

之所以把问题归结为不可能的玄学问题或者偶现事件,是因为问题超出自己的认知范围,应该努力提升自己把这类问题变为可解释和可解决的方案。

2023-03-18
4

Prometheus+Grafana的思考和实践

Prometheus+Grafana集成的监控系统已经是云原生的绝配,但是Prometheus指标到底该如何使用?Grafana到底该如何展示仍然值得思考和推敲。

2023-03-18
4

过早关注基础设施建设是万恶之源

从2014年docker提出集装箱模式的打包机制之后,服务的部署方式发生了天翻地覆的变化,国内外的云厂商陆续发布了云原生相关架构和白皮书、定制各自上云标准;并介绍自己的真实业务场景及最佳实践,介绍自己通过Kubernetes节省...

2023-03-18
4

prometheus监控进程数据-process-export

process-exporter是一个进程监控软件,可以把数据传输给prometheus进行管理

2023-02-16
4

使用Telegraf+GrayLog实现Linux业务系统服务异常时自动推送钉钉告警

使用Telegraf+GrayLog实现Linux业务系统服务异常时自动推送钉钉告警

2022-12-06
3

Prometheus AlertManager 生产实践-直接根据 to_email label 发 alert 到对应邮箱

通过之前的文章 - Prometheus Alertmanager 生产配置趟过的坑总结[1], 我们已经知道 AlertManager 作为告警平台,是非常强大的,可以去重 (deduplicating),分组 (grouping),并将它们路由 (routing) 到正确的接收器 (receiv...

2022-12-01
3

Prometheus➕Grafana监控node节点资源情况

上图中的空白处需要添加一个json文件,需要从grafana的官网进行下载,这里可以选择关于Docker的仪表盘,很多种类,这里以官方使用的为主,点击这里使用接下里要用的dashboard,进入页面后,如图所示,根据图中红线处即可下载...

2022-11-21
5

Prometheus 通过 API 接口删除指定数据

使用数据删除接口虽然可以删除一定时间范围内的 Metric 数据,但实际的数据仍然存在于磁盘上,并在 prometheus 保存的数据到期后自动清除,可以通过数据清理接口显式地清除。...

2022-11-21
4

Prometheus_arlertmanager使用说明

Prometheus将数据采集和报警分成了两个模块。报警规则配置在Prometheus Servers上,然后发送报警信息到AlertManger,然后我们的AlertManager就来管理这些报警信息,包括silencing、inhibition,聚合报警信息过后通过email、P...

2022-10-31
4

Prometheus搭建使用

上面这个配置文件中包含了3个模块:global、rule_files 和 scrape_configs。

2022-10-31
5