黄小龙
腾讯云高级工程师/腾讯云监控方案架构师,多年监控开发和应用经验,对业务监控、智能监控有深刻的理解,主导腾讯云 DevOps 可观测方案落地。
案例背景
由广州趣丸科技有限公司推出的 TT 语音是一款在国内领跑游戏社交赛道的语音社交产品。通过 TT 语音,用户可以在游戏中实时语音组队开黑,在社区语音交友以及直播聊天,广受年轻群体以及游戏玩家的喜爱。
自2014年上线以来,TT语音已累计超1亿注册用户,秉承“让天下没有孤单的玩家”的理念,为玩家提供组队开黑、趣味游戏、电子竞技等等互动服务。
TT语音现已成为王者荣耀职业联赛(KPL)、英雄联盟职业联赛(LPL)、和平精英职业联赛(PEL)等全球顶级电竞职业联赛官方合作伙伴。
疫情期间,网上游戏语音交友的流行让 TT 语音的用户数量有了爆发性的增长。为了快速适应业务拓展的需求,TT 语音逐渐转换成了分布式微服务的应用架构。
构建企业级链路追踪平台
痛点
- 分布式应用关系复杂,分析定位问题难:根据经验逐一排查的传统运维方法已经不再适用,需要链路追踪平台帮助定位发现问题,保证业务平稳运行。
- 开源自建平台搭建、使用及维护成本高,功能较为基础:对于采用自建开源平台的客户,普遍会碰到自建平台性能,功能和成本的挑战。
TT 语音在尝试基于开源协议自建的同时,也在市场上找寻更好的链路追踪解决方案。腾讯云应用性能观测(APM)在此时为 TT 语音提供了完整的解决方案。
解决方案
针对客户已经拥有自建平台的场景,腾讯云监控团队根据客户需求匹配了相对应的解决方案:
- 低成本平滑迁移:腾讯云 APM 支持多种开源协议的接入,保证了客户可以安全快速地迁入腾讯云 APM 平台。
- 内嵌 APM 系统:客户内部平台直接嵌入腾讯云 APM 控制台,无需登录腾讯云控制台即可使用腾讯云 APM。对接内部权限系统,为业务使用腾讯云 APM 平台扫清障碍。
该方案使得客户快速从自建系统平滑迁移至腾讯云 APM 平台,助力客户构建了完善的企业级追踪链平台。
项目成果
方案落地后,客户完成了运维平台的平稳升级,保证了业务的正常运行和用户的舒适体验,其中,该企业平台完成的能力有:
实时应用情况监控:应用列表大屏让运维团队可以实时查看应用的健康程度。同时支持应用详情查看,包括服务的黄金指标(吞吐量,响应时间,错误率)和上下游拓扑。
高可用调用链查询能力:腾讯云 APM 平台调用链查询功能配合强大的搜索能力,以及自定义采样功能、尾部采样和业务染色配置,实现分钟级问题定位能力。
稳定经济的云上平台:腾讯云 APM 以其拥抱开源的特性,在保证平台运行稳定可靠的同时,节省企业搭建、维护和使用平台成本。
总结
当企业业务高速发展时,基础架构的扩展和复杂化让链路追踪平台成为企业运维的必需。腾讯云应用性能观测(APM)能够帮助此类企业构建完善的链路追踪平台,极大提升企业提高运维能力。而对于已经拥有自建开源平台,在寻求性能更强的云上 APM 解决方案的企业来说,腾讯云应用性能观测(APM)拥抱开源的特性为企业的平滑迁移提供了保障。
腾讯云应用性能观测(APM)是一款综合指标、请求链路、业务日志的一体化应用系统监控产品,通过自动捕捉系统拓扑、灵活采样完整保留关键请求和事故现场,有效缩短故障排查时间,构建全面业务监控体系,为业务稳定性持续保驾护航。
[点击查看大图]
腾讯云 APM 为每位新用户提供15天免费试用,试用期间有 1百万 Span 免费额度。赶紧点击文末 [阅读原文] 上报应用并体验吧!
产品文档:
https://cloud.tencent.com/document/product/1463
产品控制台:
https://console.cloud.tencent.com/apm
体验 Demo:
https://console.cloud.tencent.com/apm/monitor/team?flag=apm-enter-demo
如有任何疑问
欢迎扫码进入官方交流群~
应用性能监控相关文章: