国家“十四五”规划中25次提及“数字化”,在移动互联、大数据、云计算、人工智能等数据技术的推动下,银行的IT技术架构从传统的“IOE架构”走向分布式开放架构。其运维管理模式由传统ITIL指导向“ITIL DevOps并举”演化,运维管理工具也将从ITOM、ITOA到AIOps发生颠覆性变革。
1月7日,由深港澳科技联盟和广东省CIO协会联合举办的2022年广东农信、农商行系统智能化运维专题闭门会在广州举办。会上,嘉为蓝鲸解决方案总监曾嘉成发表《构建银行自主可控的智能研运体系》主题演讲,演讲回顾如下:
01. 农信农商体系数字化转型挑战
- 智能化运维运营是数字化题中应有之义
新一代信息技术是数字化转型的驱动力,数据以及围绕着数据的运作系统是数字化转型的基础,企业经营智能化、精准化、智能化则是数字化转型的途径。在新一代信息技术的发展下,银行业务面临客户市场期望变化、银行数字化转型、多方监管趋严、互联网金融竞争、新技术成熟等一系列挑战,业务随之变迁,也对IT运维提出新要求。
2. 稳敏业务并举
业务的变迁,促使IT架构即应用架构、资源更替和运维模式的转变,从而推动研发运营模式从传统向敏捷化、智能化转变。业务变迁包括:
- 规模导向→结构、效率、质量导向:资产规模对农信农商银行业绩的贡献度正在降低,结构、效率、质量因素驱动银行新一轮业绩增长
- 扩大业务模式与范围→进入相对陌生、急速迭代互联网金融业务领域:互联网金融新模式、ToC服务方式,驱动银行纷纷拓展互联网业务
- 低频业态→高频业态:提升服务质量,并根据客户需求迅速开发迭代新产品
- 以产品为中心→以客户为中心:银行只有在客户需要的地方出现,主动挖掘、洞察客户需求,精准服务
3. 技术治理需要升级
随着IT资源与技术发展成熟,各类运维技术和研发方式不断被推出,对研发和运维管理者的判断力提高了更高的要求。这里面包括:
- 各类研发和运维的技术,例如AIOps、DataOps、APM、RPA、运维中台、低代码、运维开发平台、DevOps等
- 研发和运维管理模式,例如敏捷管理,精益管理,SRE运维,互联网技术运营方式等
- 研发和运维组织的模式,例如是继续保持传统的职能条线研发运维模式,还是转型和构建新型的研发运维管理模式
以上种种,都是在技术不断推陈出新的情况下,研发和运维管理者和运维团队需要考虑的挑战。
4. IT运维治理体系挑战
运维与研发相互提出什么要求,运维又该如何助力提升运营效率质量?农信农商行的IT运维治理体系挑战分为技术与工具、管理与流程、组织与人员三个方面,具体如下:
因此,为了应对以上四个维度的挑战,跟上数字化时代步伐,农信农商行IT业务“研运”体系需要全面转型与提升,打造以业务系统的保障、运营价值为导向的智能化敏捷研运体系。
02. 构建自主可控的智能研运体系
1. IT运维服务管理体系趋势内在分析
主要分两个方面:
① 运维主导 → 研发主导
在云原生体系的演进和IT软件研发、交付、运营的实践下,长期来看,大中型组织将由研发团队主导,以DevOps解决方案来实现研运一体化的IT运营管理,由运维主导转向研发主导。
② 自动化 → 智能化
当前运维管理解决方案以流程化(ITSM) 自动化(ITOM)为中心,来保障业务连续性和可用性。长期来看,将以智能化(AIOps)解决方案为目标,持续地在运维管理领域实现降本增效。
2. 银行IT研发运维管理体系
银行业IT研发运维管理体系主要分为四个阶段,每个阶段的特征可从操作、流程、数据、度量分析四个方面判断:
- 标准化运维、独立化研发(1.0):实现任务自动化、管控式流程、数据离散、基础度量。
- 自动化运维、研发运维局部协作(2.0):实现局部场景自动化、自动化流程编排、数据集成与积累、局部关键点度量。从1.0阶段转变到2.0阶段,需要通过自动化运维平台自建流水线研发场景,构建初级运维流程。
- 中台化研运、研发运维一体化(3.0):实现端到端自动化、敏捷化流程、数据多维融合、全局化度量管控。2.0阶段到3.0阶段,需要通过研发运维PaaS,构建端到端的自动化,促进研运数据融合,建设研运度量体系。
- 智能化研运、研发运营一体化(4.0):实现智能自动化、智能化流程、智能分析建议、智能反馈改进。3.0阶段到4.0阶段,需要建设MLops实现智能机器学习,由自动化向AIOps转变,并基于度量体系实现运维智能改进,基于融合数据实现数据智能分析。
3. 新一代IT治理中台架构
银行界翘首以盼的新一代IT治理中台架构,是能够实现能力、组织和流程整合的“自生长”体系,让研发专注业务代码、运维专注业务服务、运营专注运营改善,各部门得以各司其职,快速实现需求、上线交付、持续运维、技术化运营全过程。
4. 农信农商行的智能化研运中台蓝图
农信农商行的智能研运体系中台,是基于中台技术架构,打通需求-开发-交付-运维-运营的全流程闭环所构建,并通过组织、流程、工具的无缝紧密联动,提高了银行IT治理上研发效能、运维效率和运营价值,能够持续助力市场竞争与应变。
研发运维运营中台能力架构核心在于:能力沉淀、场景覆盖、视图呈现,持续纳管IT技术设施并优化业务研发、运维、运营过程,集成已有能力,整体保持中台架构。
- 智能研运能力层:将IT设施管控接入,集合已有能力,构建项目管理、敏捷协同、统一监控、AIOps等新能力。
- 智能研运场景层:通过API Gateway和开发者中心将能力组装接入,能够实现各大研运场景,包括需求场景、开发场景、测试场景、AIOps场景等。
- 智能研运视图层:将场景分成研发效能场景、运维服务场景、运营分析场景进行视图场景展现,提升业务应用生态效能。
1)自主可控的研运中台
应需求快速响应迭代、能力/数据一体化战略、TCO总拥有成本优化和国产信创安全管控四大要求,结束“黑匣子”被动管控的旧有模式,建设研运一体自主可控中台。具体实现如下图:
2)智能化研运中台体系
嘉为蓝鲸AIOps解决方案以数据和模型为核心,构建面向业务的智能化运维体系。务必基于数据驱动,基于日志数据、指标数据、事件数据等数据驱动,优先集成赋能在平台管控能力上,再通过API网关接入异常检测、指标预测分析、根因分析等实际应用场景,而非空中楼阁凭空设想新场景。
通过智能化敏捷研运中台建设实践落地,彻底打通研运管理、研运工具、研运组织的连接,在研发运维管理和工具间构建起敏捷循环。不仅如此,智能研运中台为构建研发运维运营之间的工具链条循环、数据链条循环、服务与能力链条循环,奠定深厚基础,为实现真正意义上的端到端的完成持续交付做好充分准备。
03. 智能研运体系典型价值场景
银行可通过构建DevOps和ITOM/ITOA的全链管控,实现过程、质量、安全的多维数字化转型。
基于DevOps理念构建的标准化交付流水线,内置代码检查、功能测试、质量自动化审核等功能,全方位提升研发交付质量,同时对交付过程中产出的代码、测试用例、制品、报告等资产进行统一管理。
农信农商行还需要通过构建ITOM和ITSM敏捷化服务管理场景,实现数据融合度量,切实保障农商业务高可用性高连续性,以及可通过日常自动化运维场景及成熟度模型,判断银行所在的成熟度级别。
同时嘉为蓝鲸分享了AIOps智能化场景能力成熟度模型,分别从质量保障、效率提升、成本管理三大领域维度进行设计,每一类领域分别从五个等级逐步:
L1:初始级:简单智能化
L2:成长级:单场景智能化
L3:成熟级:多场景协同智能化
L4:专家级:决策建议智能化
L5:卓越级:无人值守智能化
常见场景比如:用户体验管理、资源池容量预测、业务资源容量预测、异常故障自愈类、日志聚类分析、智能调参等等。
嘉为蓝鲸研运一体化平台还能实现可观测、可视化、数字化的呈现分析,比如领导驾驶舱、业务运行态势感知、客户体验监控、研发过程盯盘、机房动环监控和运营报表中心/日周月报等。
04. 智能化敏捷化研运体系对农商业务发展的长远意义
① 响应数字化时代号召,实现运维模式的数字化转型
金融业数字化转型是大势所趋,并不只有业务与开发团队需要进行转型,运维团队也要紧跟时代步伐,进行全方位数字化转型,持续保持领先地位。
② 对接业务与DevOps,实现端到端的持续交付
随着DevOp理论和工具的成熟,业务开发团队正在进行从管理到工具链的全方位敏捷转型,研发运维并没有真正意义上一体化,需要通过技术、管理、组织等多方面建设,迎头赶上。
③ 实现更加敏捷、优质、高效的业务系统迭代、保障与运营
以客户和业务为中心的敏捷组织,通过同一平台支撑的敏捷ITSM管理实践为中心,充分融合ITSM ITOM的研发运维工具体系,能够实现更加敏捷高效的业务系统迭代、保障和运营。
④ 为迈向智能化做好全方位的准备
智能化的前提是全方位的端到端自动化,以及研发运维管理的敏捷化、线上化和结构化;打造敏捷化研运体系有利于做好智能化前夜的全部准备,随时迎接智能化驱动时代到来。