最新 最热

关于Prometheus在K8S中的部署方案如何选择,以及分享手工部署的YAML

对于技术的选型,往往是没有规定死是要用哪一项技术的,而是需要结合业务的需求、运维场景、自身对某项技术的掌握程度、以及其它更多的考量因素来共同决定的:...

2023-07-17
1

Prometheus的架构原理,如何使用其进行监控告警配置实现?

在现代IT架构中,监控和告警是非常重要的一环。随着云计算、大数据、容器等技术的普及,服务数量也呈爆炸式增长,管理这些服务的健康状态和性能指标变得更加困难。Prometheus是一个开源的监控和告警系统,已经被广泛应用于生...

2023-06-06
2

wgcloud监控进程 - 自动恢复指令是什么

自动恢复指令,就是当系统发现进程被kill后,会自动执行此处指令自动恢复指令一般是用于恢复启动进程的命令,也可以是其它的处理逻辑自动恢复指令,v3.4.6开始,支持进程下线后,自动触发恢复指令或脚本,agent会在检测到进程下线...

2023-05-17
3

WGCLOUD监控系统的实际应用 - 配置outlook邮件告警

在server/config/application.yml,在配置项warnToUnicode下增加一行参数javaXmail即可使用outlook邮箱、TLSv1.2发送告警邮件,如下

2023-05-11
3

腾讯云Prometheus agent容器镜像制作

重启后会自动拉取prome job配置更新到/opt/prome/etc/prometheus.yml中

2023-03-29
5

分布式云场景下的多集群监控方案最佳实践

杨濡溪,腾讯云后台开发工程师,目前主要负责腾讯云 Prometheus 监控服务、TKE集群巡检等技术研发工作。杨鹏,腾讯云后台开发工程师,曾负责腾讯云专有云后台技术研发工作,目前主要负责腾讯云 Prometheus 监控服务、TKE集群后...

2022-11-24
5

【云监控游戏行业案例9】欢乐斗地主是如何解决运维焦虑的?

| 导语 :你是否也曾被“快点儿吧,等到花都谢了”洗脑,为又爱又恨的欢乐豆决战到天亮,为何欢乐斗地主能风靡全国,经久不衰,还一直能平稳流畅运行?其背后究竟有哪些运维小妙招?可让整体研运效率显著提升,节省30%+人力成本?.....作...

2022-11-15
1