半年内36个“App崩了”的热搜,是时候聊聊混沌工程的探索与实践了!| Q推荐

2023-04-01 16:32:42 浏览数 (1)

叮铃铃~ 程序员小陈的电话响了,刚进入梦乡的他睡眼朦胧的在黑暗中摸出手机,“喂...... 哪位......”

“最近升级的 2.3.7 版本,又出现了 bug,客户在问了,尽快处理下!”

“好...... 这就去......”

加班修 Bug 已成为小陈的家常便饭。查验问题,处理故障,恢复服务...... 估计前半夜又没得睡了。这样的经历,作为程序员的你一定也并不陌生。

近年来,云原生架构的广泛应用及微服务的普及令开发的便捷性大幅提升,随之而来,复杂的分布式服务体系中,故障发生的随机性和不可测试性也大大提高。微博上时常能看到各大 APP 崩了的热搜。据知微舆论场统计,今年上半年这样的微博热搜共出现了 36 次。

系统越复杂,越脆弱。在复杂式分布系统中,任何微小的变更,都可能诱发蝴蝶效应,导致大面积的系统瘫痪,从而让企业承受高昂的损失。如何能提前探知和解决潜在的系统风险,降低故障发生的概率,真正实现云上韧性架构?

混沌工程正是这样一门新兴的技术学科。自 Netflix 在亚马逊云科技上发布了一款名叫 Chaos monkey 的服务,可帮助工程师快速了解他们正在构建的服务是否健壮并有足够弹性,混沌工程开始兴起。目前,国内外的多家大型互联网公司都采用某种形式的混沌工程来提高现代架构的可靠性。多年来,亚马逊在该领域不断探索,并于今年宣布推出自己的混沌工程服务 - Amazon FIS (Fault Injection Simulator)。

越来越多的开发者们开始在这一领域展开更多探索。9 月 15 日 Tech Talk 将从亚马逊云科技在混沌工程的探索与实践出发,深度剖析企业实践混沌工程的常见难点,以及如何借助 Amazon FIS 服务落地混沌工程。

本期主题

亚马逊云科技在混沌工程的探索与实践

讲师介绍

黄帅,亚马逊云科技资深开发者布道师。

在软件研发和咨询领域超过十年的架构设计、运营和团队管理经验,对云上分布式架构设计和优化、XOps、微服务治理、云原生运维、分布式可观测性构造与混沌工程企业实践等有深入的研究和丰富的案例经验。近年来,持续在混沌工程实战领域,受到海内外大会邀请,分享有关亚马逊云科技的经验和案例,引起共鸣。自 2019 年推动新的亚马逊云科技混沌工程服务(FIS: Fault Injection Simulator)立项与落地,该服务于 2021 年 3 月成功发布。

听众受益

  • 混沌工程能够对 IT 人员带来什么价值?
  • 混沌工程的发展历史及未来趋势是什么?
  • 混沌工程适合哪些工作场景?
  • 混沌工程在数字化企业中的实践难点和思路? 报名方式

点击【阅读原文】或扫描海报上的二维码即可报名,开发者报名后会立刻收到确认邮件,请注意查收~

0 人点赞