最新 最热

prometheus (四) 黑盒监控

简单查询一下 count(node_cpu_seconds_total{instance="1.1.1.4:9100",mode='system'})

2023-05-02
5

Prometheus监控系列三 | 架构详解

用于收集和存储时间序列数据。Prometheus Server 是 Prometheus 组件中的核心部分,负责实现对监控数据的获取,存储以及查询。 Prometheus Server 可以通过静态配置管理监控目标,也可以配合使用 Service Discovery 的方式...

2023-05-02
2

Prometheus监控系列二 | Docker容器化部署实战

访问 http://ip:3000,初始账号密码为 admin/admin,会要求更改密码。

2023-05-02
2

prometheus (一) 简介及部署

基于 centos7.9 docker-ce-20.10.18 kubelet-1.22.3-0 kube-prometheus-0.10 prometheus-v2.32.1

2023-04-27
2

通过prometheus读取腾讯云TMP监控数据

现在很多业务会通过云上的TMP来监控云上的业务,比如将云上的tke、etcd等服务监控数据写到TMP,然后方便监测服务是否正常运行。

2023-04-11
2

三大示例实战 Prometheus API 使用

做为一位优秀的技术人员,往往能通过对数据的最大化利用来产生更多价值。而Prometheus的监控数据则是可以为我们所用的重要数据,它并不只能用于日常的监控和告警使用,也可以用于数据分析、成本管理等企业需求。...

2023-03-20
5

K8S 1.25 这两个特性,减少应用滚动上线停机时间

本文描述了两个特性,即用于 StatefulSet 的 minReadySeconds 以及用于 DaemonSet 的 maxSurge, 很高兴宣布这两个特性在 Kubernetes 1.25 进入稳定阶段。

2023-03-19
4

为什么我们选择 Thanos 进行长期指标存储?

应用程序开发人员根据用于态势感知或识别长期趋势的指标创建仪表板。他们希望衡量他们的增长并将今天的每日活跃用户与一年前的价值进行比较。

2023-03-18
5

衡量软件系统稳定性三个常用指标

每个软件开发人员可能对什么是健康的软件项目都有自己的想法。可能是产生了巨大的商业价值,也可能是解决了某个领域的难题,就我个人而言,如果这个项目可维护、可运营,就可以称之为健康的项目。那么关于可维护、可运营的项...

2023-03-18
4

Cluster out:一种构建现代应用程序的设计方法

我们正在将单体架构转换为微服务,采用服务网格,并从“分布式和解耦优先”的角度接近世界。我不太喜欢引入新术语,但是企业内部不断出现一个概念:“Cluster Out”。意思就是:清晰的愿景,新鲜的代码,对开源的新承诺。...

2023-03-18
3