监控产品常见问题(第1期)

2021-11-09 10:10:06 浏览数 (1)

Prometheus 监控服务(TMP)

1. TMP 和自建有什么区别吗?

TMP 完全兼容开源生态,并与腾讯云监控数据打通,帮助用户快速搭建监控体系(自定义监控,组件监控,基础监控等),支持 Grafana 并预设了常用的监控 Dashboard,支持丰富的 Exporter 并预设了常见的告警模板;很好解决了开源社区 Prometheus 高可用搭建困难, Prometheus 性能可扩展性差,运维消耗人力等痛点。

2. TMP 的监控数据是怎么采集的?

通过 Prometheus agent 拉取,也支持通过 pushgateway 方式写入。完全兼容开源 Prometheus 采集方式。

3. TMP 每个实例都是一个单独的 exporter 吗?

目前社区中 MySQL,Kafka 这种是一个实例一个 exporter,Redis是支持一个 exporter 多实例的。

4. 自建 Prometheus如何迁移到 TMP ?

在自建 Prometheus 的配置文件中加一个 Remote Write 配置指向到 TMP 即可进行迁移。

5. TMP 是否支持自定义上报数据?

支持,TMP 支持多种语言自定义上报指标监控数据,并展示在集成的 Grafana 大盘中。

5. TMP 是否支持自定义上报数据?

支持,TMP 支持多种语言自定义上报指标监控数据,并展示在集成的 Grafana 大盘中。

6. TMP 是否支持哪些云产品?

云服务器、云数据库 MongoDB、云数据库 MySQL、云数据库 PostgreSQL、云数据库 Redis、ElasticSearch、容器服务等,可在控制台集成中心查看。

应用性能观测(APM)

1. 分布式链路追踪的原理是什么?

为每一次请求生成一个 TraceID 并且透传整个调用过程,通过 TraceID 即可串联整个调用链。

2. APM 支持什么框架?

APM 支持探针支持 Tomcat、Spring Boot、gRPC 和 Dubbo 框架。更多的框架,用户可使用其他开源 SDK 采集上报,应用性能观测能够兼容并帮助您更好的呈现

3. 为什么只有 trace 数据,无 metric 数据?

大概率是 span.kind 上报的有问题,APM 只抓取【client、server、consumer、producer】四种 span.kind,请确保您的 span.kind 类型在这四种里。

4. 链路数据在 APM 存储多久?

试用期默认存储 3天,正式计费后您可以按需选择存储 3天、7天、15天或30天。

5. APM 支持哪些协议和哪些语言?

a. 支持协议:OpenTelemetry,Jaeger, Zipkin 和 skywalking。

b. 支持语言:Java、Go 和 C (持续补充中) 。

前端性能监控(RUM)

1. 首屏时间(FirstScreenTiming)是怎么计算的?

监听页面打开 3s 内的首屏 DOM 变化,并认为 DOM 变化数量最多的那一刻为首屏框架渲染完成时间(SDK 初始化后 setTimeout 3s 收集首屏元素,由于 JS 是在单线程环境下执行,收集时间点可能大于 3s)。

2. 性能里面的 DOM解析 (DOM parse) 时间是如何计算的?

PerformanceTiming 接口中的 domInteractive 到 domLoading所消耗的时间。

3. 性能数据和日志保存时效是?

a. 用户上报的原始日志,包括错误,自定义上报,页面访问,保留30天。

b. 性能相关的指标数据,如页面性能,API 监控、静态资源监控等,保留 15 天

c. RUM 每天定时计算得出来的数据,比如每天的项目评分,每天的 PV/UV 汇总数据等,是永久保存的。

4. 什么是离线日志?

离线日志是把大部分日志存储在用户本地,只有在需要使用的时候才把日志上报到监控平台的解决方案。

5. RUM 采集数据时用的时间是客户侧(如浏览器)还是服务侧的。中间的延迟大概会有多久?

服务侧的,时间显示会比实际上报延迟 1s-2s,日志搜索可能有 1-2 分钟延迟。

联系我们  

如需了解更多产品相关文章可点击下方链接:

Prometheus 监控服务实践指南

【重磅发布】应用性能观测(APM)

前端性能监控(RUM)

如需了解更多产品介绍请点击公众号底部菜单。

0 人点赞