"鹅厂网事"由深圳市腾讯计算机系统有限公司技术工程事业群网络平台部运营,我们希望与业界各位志同道合的伙伴交流切磋最新的网络、服务器行业动态信息,同时分享腾讯在网络与服务器领域,规划、运营、研发、服务等层面的实战干货,期待与您的共同成长。
网络平台部以构建敏捷、弹性、低成本的业界领先海量互联网云计算服务平台,为支撑腾讯公司业务持续发展,为业务建立竞争优势、构建行业健康生态而持续贡献价值!
《庄子•秋水》有言:“物之生也,若骤若驰,无动而不变,无时而不移”,万事万物是无限的且时刻处在永恒的变化与流动之中,唯一不变的就是变化本身,腾讯亦是如此。
伴随着公司业务的蒸蒸日上,腾讯基础网络的规模迅速壮大,网络架构的复杂性与日俱增。网络变更的数量更是水涨船高,从2010年的3067个猛增到 2014年的6216个,足足翻了一倍。
大家不禁要问,腾讯网络变更管理团队到底有什么秘密武器?笔者根据3年多的实战经验总结了腾讯网络变更管理的七种武器(7C),下面就为诸位看官娓娓道来。
变更管理的七种武器
- Criterion
- Conditions
- Checkup
- Craft
- Cloud
- Capacity
- Competition
第一种武器:Criterion --规范基线
腾讯每年网络变更的数量已经达到6K的量级,CASE-BY-CASE的管理显然是不符合实际情况的。腾讯变更管理团队建立了Criterion,即变更规范基线,以此来把控网络变更的整体规范性,堪称大杀器。
那么这条规范基线具体是怎么建立的呢?
首先,制定变更管理规范,确立变更窗口安排、人力分配、变更申请、审批、实施、公告这些变更要素的基线。 其次,制定变更实施坚决避开的那些红线,明确列出容易被忽视的细节,避免低级错误。然后,对新入职的同事,都要进行变更规范意识的培训和测试,确保所有网络变更都达到Criterion --规范基线的要求。
第二种武器:Conditions--场景模式
奠定了规范基线之后,腾讯变更管理团队对常见的网络变更进行梳理,精细提炼为7大类,合计91个Conditions—场景模式。
每个变更场景都明确了变更的级别、建议变更实施窗口、变更预计影响、变更风险。并且,变更场景的评估标准会根据变更工作的实施质量而动态刷新哦。
此外,变更管理团队正在制作各个变更场景的定制变更方案模版,以进一步提高精细化管理水平。
第三种武器:Checkup--变更评审
变更管理团队定期于每周五下午审视下周的所有重要变更,并且对非常规的高难度变更以及试点类变更进行Checkup--变更评审。
变更评审,除了关注变更方案的技术细节之外,还会重点评估各个变更之间的横向交叉影响,比如:DWDM变更对波道的影响与其他网络产品的流量切换是否有影响、同一段时间对厂商支持人力的需求是否超标等等。
第四种武器:Craft--操作工艺
前面三种武器都是在变更的筹备阶段使用,那到了变更实战阶段又有什么黑科技武器呢?
嘿嘿,这次不是黑科技,而是网工们的手活,即Craft--操作工艺。
网络变更是非常细致的活,JUST DO IT? NO!
首先,变更管理团队提炼出风险控制方法论,对通用实操工艺作了详尽的研究,在网工团队中普及。
其次,对于容易失误的场景,推广经典工艺,比如链路调试工艺,谁用谁知道。
此外,变更管理团队对变更抽检,审计具体的操作工艺是否合理。每位网络工程师头顶高悬达摩克利斯之剑,谨慎实操,确保飞机在飞行中顺利更换引擎。
第五种武器:Cloud—云化支撑
网络变更工作具有一定突发性以及网络产品专业方向的特点,导致在一段时间内部分同事的变更工作压力特别大,可能会成为水桶中的短板。
对于这种情况,变更管理团队拿出第五种武器,
Cloud—云化支撑。
大家不禁要纳闷了,刚才你不是说变更存在网络产品专业方向特点吗?现在怎么又说云化支撑呢?
是的,变更存在网络产品专业方向特点,不是随随便便就能做的。也正因为这个缘故,变更管理团队与产品团队联合启动云PE培训、认证、统筹机制:
1)梳理出各个网络产品的技术框架以及难度相对较低的变更场景,对网络工程师进行多次交叉培训,每次学习期1个月
2)由产品团队测试学习者对本产品大局框架的基本认识,以及对指定云化工作的掌握程度,最终向变更管理团队反馈学习者是否具备该产品云PE能力以及能独立实施的变更场景;
3)后续网络产品团队面临突发过载任务时,可以申请将一部分可以云化的工作打包出来,由变更管理团队根据前期云PE培训结果统筹安排。
第六种武器:Capacity—能力优化
小伙伴中应该都记得政治课中有一句非常经典的论断,“我国社会的主要矛盾是人民日益增长的物质文化需要同落后的社会生产力之间的矛盾。”相似的情景就在我们身边:我司业务蒸蒸日上,在严格控制非必要变更的情况下,网络变更的数量仍然水涨船高,而网工团队的人员数量不可能一直膨胀。
放眼3年后,如果变更数量再翻一倍,怎么应对?
且看变更管理第六种武器,Capacity—效能优化:
1)与开发团队密切合作,引入自动化工具支持,比如自动化链路调试已经完成试点并在推进批量应用,后续更会有自动化扩容实施等功能;
2)开辟成熟低风险网络变更外包模式:与服务管理侧和开发团队协作,梳理网络变更外包的流程和与第三方平台对接。在做好风险控制的前提下,引入外包服务商实施成熟低风险的网络变更。
第七种武器:Competition--竞争氛围
看到这里,有些朋友不禁要问了:前面六种武器都是偏重于从外部管理出发,但网工们的主动性也很重要啊……
没错,主动性对于我们的工作至关重要。变更管理的第七种武器Competition--竞争氛围,就是为了保护大家的主动性。
变更管理团队每月组织“优化之星”竞选活动:综合评估网工们上月变更实施的质量和数量,提名3位候选人整理优秀事迹,变更管理团队在部门内发布并启动全民票选,最后变更管理团队公布“优化之星”竞选结果,授予激励。
通过“优化之星”竞选活动,一方面在部门内展示了网工们的专业形象,另一方面,营造出对变更精益求精的竞争氛围,网工们不断主动提升技能,整体变更质量稳步提升。
总结
以上浅谈了鹅厂网络变更管理的七种武器(7C:Criterion、Conditions、Checkup、Craft、Cloud、Capacity、Competition),这也是网络变更管理团队近3年来实战工作的方法论总结。
希望对大家有所帮助,更希望抛砖引玉,期待了解到各位同仁的真知灼见,携手共创美丽网络新世界,连接一切!
注1:凡注明来自“鹅厂网事”的文字和图片等作品,版权均属于“深圳市腾讯计算机系统有限公司”所有,未经官方授权,不得使用,如有违反,一经查实,将保留追究权利;
注2:本文图片部分来至互联网,如涉及相关版权问题,请联系tracyyun@tencent.com