作为 Webfunny 的 PMC,应伟长期致力于前端监控、埋点探针的产品研发,伴随着全链路监控的探索,在整合 Skywalking 与 Zabbix 打造一体化监控平台的实践中,是怎样的心路历程?
“
从前端监控到全链路监控的挑战
Webfunny 自2019年发布以来,收获 GitHub Star 4.1k,向数百家企业提供企业级服务。
“衔接前端监控与基础监控的必经桥梁就是应用链路监控,当 Skywalking 资深玩家修能手持 Skywalking 遇到我的 Webfunny 时,就注定了 Walkingfunny 的诞生”
纵观全局
观纵科技是由 Webfunny 与 Argus 团队整合而生的,在 DevOps 领域开源的应用与发布是观纵持续的旋律与态度。
观纵的观测三剑
RUM 观测:Webfunny
前端是用户体验和项目问题的第一发源地,只有掌握第一手信息,才能够更准确、更及时的发现和定位线上问题。
全链路观测:Walkingfunny
通过整个链路的追踪快速定位问题与风险,在 Skywalking 的基础上融合 Webfunny 重构前端探针,增强 OAP 服务能力。
IaaS & PaaS 观测:Argus
以 Zabbix 为核心采集,自研 ArgusNMS 模块,从拓扑图到自动发现,分布式部署,完整的监控 IaaS 与 PaaS 层的对象资源。
Webfunny 前端监控
从前端工程的流量、性能、错误等多维度监控,分析应用活力,从埋点探针分析业务流程转化,挖掘界面背后的事件归类及行为价值。
01
前端监控
- 帮助产品经理观测用户行为,为产品持续优化带来思路
- 帮助数据分析师挖掘趋势流向,协助商业价值转化决策
- 帮助开发者发现错误异常、定位前端程序故障源
02
数据分析
抓取 最有价值的流量数据分析用户画像
- 通过性能分析 感知 用户真实体验
- 通过错误分析反向源码 定位、聚合 归类
- 通过用户细查 检索 行为记录,复现 用户问题
03
埋点监控
埋点观测
数据转化漏斗
Walkingfunny 全链路监控
全链路应用性能监控 = Skywalking × Webfunny,实时动态生成全链路拓扑,自定义探针开发,业务聚合分析。
01
生态
完全兼容
Skywalking 生态
- 新增了 RUM 探针 以及对应的数据接收和处理模块
- 保留所有 Skywalking 原生支持 的探针和数据上报结构
- 重新开发了前端的 展现逻辑 以及交互 体验
02
列式存储
基于 Clickhouse 列式存储完全重构了
Skywalking 的整个存储模型
- Batch 写入速率提高近一倍,查询延迟全部在毫秒级
- 单表多列进行压缩后,相较于 ES,存储成本仅需原本的 10%
- 同等环境下,机器规模可以节省将近 50%
03
探针自定义开发
探针自动抓取相应数据包
- 数据分析可以精准定位到具体的 特定用户 ,真正做到用户体验分析
- 会话、页面、资源、操作、错误等 5个纬度 统计分析
- JS探针侧优化了上报的逻辑,更 节省 用户端资源
- 支持 自定义 埋点数据上报,汇聚业务 特定指标 数据
Argus IT 基础监控
Argus 基于 Zabbix 二次开发,面向私有化及混合云数据中心,提供全方位多层次的统一监控和运维管理平台,帮助用户实时对各类IT资源(网络设备、服务器、存储、数据库、中间件、虚拟化平台等)执行性能指标监控,实现事前运维。
V 3.4 Changing Logs
01
资源监控详情自定义拖拽
自定义开发多种图形化组件
融合“Zabbix LLD数据模型”&“基础监控设施特征”
02
全自动生成网络拓扑
多协议自动发现
基于生成树;CDP;LLDP;OSPF;ISIS;ARP…
03
事件中心实时降噪
把规则定义的同类事件合并成为事件集
自定义告警聚合事件规则