↑↑↑关注后"星标"炼丹笔记
炼丹笔记·竞赛
2022 CCF国际AIOps挑战赛
赛题介绍
2022第五届CCF国际AIOps挑战赛延续对故障发现的深入探索,首次引入故障分类赛题,以“微服务架构电商系统下故障识别和分类”为赛题,挖掘故障模式、构建分类模型以作用于故障止损场景。
比赛将全程在建行云环境下完成,参赛选手需自行设计异常检测算法和故障分类算法,实现准确高效的故障检测和故障分类。
比赛背景
近年来软件系统领域有两个显著的趋势。第一个趋势是随着云计算的发展,软件系统架构由单体架构逐渐转变为面向服务的架构。如此便可开发细粒度、松耦合、通过API互相连接的服务,达到持续开发和灵活扩展的目的。
其中微服务架构就是典型代表,部署在云上、面向服务的架构可以适应系统规模的快速增长,具备更快的迭代速度、更低的开发复杂性和更好的可扩展性,但它的部署和运维复杂性却大大增加,给故障检测和诊断等运维工作带来挑战。
比赛数据
本届挑战赛的数据来源于基于微服务架构的模拟电商系统。系统部署在建行云上,其流量和真实业务流量一致。故障场景是由真实系统中总结的故障类型,分批进行故障重放。
- 本批训练数据一共包含7天的有故障数据(training_data_with_faults.zip)以及3天无故障数据(training_data_nomal.tar.gz)
- 为了在比赛中为大家提供更多的数据,一共并行部署了三套一致的系统(cloudbed1, cloudbed2, cloudbed3),选手可以根据需要自行对数据进行拼接。
今年的故障诊断题目从根因指标定位改为故障分类。根因指标定位是一种无监督方法,但是根据实际的运维经验,故障根因的分布是满足28定律的,其80%故障的根因总是那么几种,且完全无监督的方法忽略了历史故障信息。
优胜方案