简介
前言感谢各位用户在云监控用户交流群中的积极发言,踊跃提问,感谢大家的支持,在此把 Grafana 插件和 Prometheus 监控服务相关的一些问题整理如下。
Grafana 插件
腾讯云于 4 月 20 日宣布与开源数据可视化平台 Grafana 的 Grafana Labs 合作,为全球云用户提供腾讯云 Grafana 云监控应用程序插件。用户可通过此插件,在简单易用的平台上快速监控与整合指标和数据。目前已经支持 30 款腾讯云基础产品的接入展示。点击此处了解 Grafana 插件
Q:secretid secretkey 需要关联什么策略才能使用 Grafana 云监控应用程序插件?同时,也希望配置具体的监控权限
A:和云监控 API 拉取所需要的策略相同,云监控只读访问权限 QcloudMonitorReadOnlyAccess 或全读写权限 QcloudMonitorFullAccess,同时赋权对应的云产品策略,具体可参考 https://cloud.tencent.com/document/product/248/45428
Q: 用 Grafana 插件的用户看全部云产品需要配置什么权限?
A: 只需要给子账户设置全局只读权限即可,如下图所示(https://console.cloud.tencent.com/cam/policy/detail/400411&ReadOnlyAccess&2):
Q:变量如何支持多选呢?除了建多个 panel/query 之外有别的推荐的方式吗?希望能在一个 Dashboard 一次看到所有的实例状态。
A:可以通过模板变量的方式配置
在配置模板变量的时候勾选 multiple value,下拉框就是多选的,因为默认的模板是单实例的,多实例可以在单实例模板上新建自定义模板。
Q:区域支持多选吗? A:暂时不支持多选
Q:我在腾讯云 Grafana 应用插件提供的模板中,添加了 Variables:InstanceName,但是切换展示源的时候图表信息不会随之改变?
A: 可以在 publicIp 模板变量后面添加 &display=InstanceName−{InstanceId} 拼接你想展示的 InstanceName 和 ID,就不用单独创建一个 InstanceName 的模板变量了,因为自己创建的变量没有在 Dashboard 中绑定使用 https://github.com/TencentCloud/tencentcloud-monitor-grafana-app/#模板变量
Prometheus 监控服务
Prometheus 是一个开源监控系统。现最常见的 Kubernetes 容器管理系统中,通常会搭配 Prometheus 进行监控。腾讯云 Prometheus 监控服务(Managed Service for Prometheus TMP)在继承开源 Prometheus 监控能力的同时 ,还提供高可用的 Prometheus 服务、开源可视化的 Grafana 和云监控告警,可以减少用户的开发及运维成本。
Q:能介绍一下和自建有啥区别吗,感觉社区都有? A:自建有运维和研究改造社区版本的成本,使用云服务能节省这些运维成本。同时,腾讯云 Prometheus 监控服务也会集成常见服务的大盘和报警,节省开发成本。
Q:怎么配置自定义监控? A:可以在控制台中点击集成容器服务 ->TKE 集群 ID-> 服务发现中创建 PodMonitor/ServiceMonitor。 目前可以通过 Prometheus 监控服务完成自定义指标上报,具体的指引可以参考:https://cloud.tencent.com/document/product/1416/56027
Q:是否可以定期查询某个集合,当该集合的某个字段超过阈值就报警?
A:这种业务性质的,估计业务方根据自己的特点来自己实现了,用 Prometheus client 写一个就好了。
Q: 将 Prometheus svc 创建到 VPC 网络中,通过内网页面访问,发现页面上没有查询的功能模块(背景是项目会自己创建 service monitor,通过服务发现,收集自定义指标到 prometheus 中,再查询页面进行数据验证、调试)?
A:产品已经都已经集成了以上功能,数据源默认已经加上,用户还需要自行加上 service monitor,然后在 Grafana Explore 验证数据是否过来。
Q:我们自定义的的数据通过自动发现存储到你们的 Prometheus 中,现在我们自己的监控系统需要引用这个数据源,是否可以支持?
A:可以支持
Q: K8s 的存活检查,能检测到么? A: 可以用 blackbox -exporter,新版本的 Prometheus Operator 已经可以直接集成了。详情可参考:https://cloud.tencent.com/edu/learning/live-3288
Q: 我自建的 Grafana 能不能对接你们的 Prometheus? A: 支持,只要自建的 Grafana 和腾讯云 Prometheus 监控服务在一个 VPC 内自建就可以对接。
Q:Prometheus 监控服务是否可以 remote write 到我们自建的时序数据库里? A:支持,如果原来自建了 Prometheus,改一下 remote write 配置数据就可以到托管服务上,remote write、pushgateway 的地址在实例详情里可以找到。
其它
Q: 如果子机的 agent 因为机器的性能瓶颈了,导致监控丢失会触发告警吗? A:可以通过配置 ping 不可达实现。
Q:ping 不可达是自动开启的吗? A: 需要在告警配置中设置对 ping 不可达 这个事件进行订阅。
感谢:@Kasun,@sophie mar @奈 @虻梦 @soul @姿态 等等~同学的咨询和反馈~让我们离用户更近:)
欢迎联系云监控小助手微信号,加群讨论:)