金融业运维体系指南-嘉为蓝鲸

2022-04-24 15:47:41 浏览数 (1)

为加快数字经济建设,推动金融高质量发展,金融行业正大力推进数字化转型。IT运维管理作为企业运营中的环节,在数字化浪潮下,应主动出击,进行数字化能力升级,发挥自己独特的价值。

银保监会下发的《关于银行业保险业数字化转型的指导意见》中,提到要建立"前端敏态、后端稳态"的运行模式,同时还需建立能够快速响应需求的敏捷研发运维体系,积极引入研发运维一体化工具等科技能力建设。

本文作者是嘉为科技负责金融行业的顾问赵海兵老师,老师在金融行业深耕钻研数年,主导多个中大型金融单位的运维体系咨询与项目建设,深度调研访谈了多家金融业标杆客户,对于金融行业的运维现状、需求痛点、趋势变化和最佳实践等有深入的理解和洞察。

赵老师认为,金融行业相对来说,是信息科技实力比较靠前的行业,尤其是银行、保险和证券为代表的金融行业。同时,整个行业的开放度很高,对新科技、新理念的接受度很高,从业人员的素质也很高。因此,金融行业在科技板块(包含运维)的建设,在全国名列前茅。很多新技术或新理论,通常都是先在金融行业开始,然后逐步蔓延到其他行业。

当然,金融行业在这些年来,也受过许多大大小小的冲击,为此也一直在摸索转型。通过近些年来的研究,我们发现尽管各家金融单位的运维现状不同,采取的措施也不尽相同,但是还是有相当大一部分共性是可以拿出来讨论和参考的。我们今天不聊技术,单从运维体系的较为宏观的角度,去讨论数字化转型浪潮下,金融企业运维体系应该如何去建设和转型。

01. 为什么要建设智能化敏捷运维体系

1. 国家政策的要求

银保监2022《数字化转型的指导意见》里,明确的提及关于运维体系该怎么建设,并从技术、组织维度都下达了具体要求,见下图:

▲ 银保监会《指导意见》中提到的具体要求▲ 银保监会《指导意见》中提到的具体要求

其实,已经有一些嗅觉敏锐的银行在悄然落实《指导意见》的内容。比如开始尝试在运维团队内部构建扁平化团队;还有些把研发和运维一同构建技术小组,为某一个产品项目负责;更有甚者,让需求端的项目管理人员和业务管理人员都拉一起,共同为项目和产品的整个生命周期负责。

2. 权威机构的建议

Gartner是著名的专业咨询机构,它在解读数字化时解释道:“数字化要改善组织流程、改善人员,组织与事物之间的交互……开发数字技术和支持功能以创建强大的新数字业务模型。”

国务院发展研究中心在解读数字化时,提到:“打通不同层级与不同行业间的数据壁垒,提高行业整体的运行效率……以数据为关键要素,通过实现企业的生产智能化、管理智慧化…...企业经营智能化、精准化、智慧化则是数字化转型的途径。”

因此,数字化转型的方针拆解到运维层面,就是用数字化技术改变运维模型的过程,也是要求运维要智能化,要足够敏捷足够快的响应业务需求。

3. 咨询公司的解读

一些国际知名的咨询机构,比如麦肯锡、埃森哲、IDC、IBM等,基本都在自己的数字化定义里提及智能化运营。因此,智能化敏捷运营是数字化转型的题中应有之义。

Gartner还提到,敏捷对于数字化转型路径、开发与交付、运营模式的变革都有着意义。敏捷或者称作“以产品为中心的敏捷交付模式”俨然成为了当下数字化转型的主流。

咨询机构和Gartner对于敏捷的定义咨询机构和Gartner对于敏捷的定义

由此可见,若企业尚未引入敏捷,那么其将在开发效率上大幅度落后于竞争对手。

4. 业务维度的需求

新的业务、新的系统、新的客户、新的模式等诸多挑战导致业务在进行转变,因此IT架构、资源也在变。这也就要求了运维模式寻求转变,以跟上业务的变化。

▲ 业务维度的需求分析▲ 业务维度的需求分析

5. 架构维度的需求

银行理想化的模式基本都是敏态 稳态这两种模式,并且敏态的体量是逐步往上升的。除此之外,传统的模式也在逐步剥离,以支持敏态模式。

6. 技术因素

国外也有很多理念在近些年逐步引入国内,基本上过去的运维管理都是ITIL应用运维、ITOM等等。但是现在,很多银行已经陆续在建设的比如APM、持续交付CI/CD、自动化运维、容器、DevOps、AIOps等等。由此可见,技术的迭代日新月异,金融行业也在思考这些技术到底要不要运用,以及该怎么用,从而也促进了数字化转型。

在这些大的趋势背景下,作为金融行业的一份子,该怎么去做运维的建设,又有哪些挑战呢?经梳理之后,主要分为技术与工具、管理与流程、组织与人员三大方面的挑战。具体如下:

▲ 银行运维面临的挑战▲ 银行运维面临的挑战

为了跟上数字化时代步伐,银行运维体系需要全面转型与提升,在战略上重视,再从战术上去执行。金融行业不能再期望建一个工具用三年、五年不落伍(稳态),而是工具本身能够满足持续迭代的需求(敏态 稳态)。

在这种情况下,我们就需要构建以业务系统的保障和运营价值为导向的智能化敏捷运维体系,该体系包括三个方面:

  • 运维工具:构建完备的端到端的自动化ITOM运维工具体系
  • 运维管理:构建符合ITIL4框架、融合式的、高速ITSM运维管理实践
  • 运维组织:以应用为中心的全生命周期综合支撑
▲ 银行运维体系所需要的转型与提升▲ 银行运维体系所需要的转型与提升

未来瞬息万变,金融行业想要在竞争激烈的市场环境中存活并稳定下来,需要逐步从传统的以产品为中心,向以客户和业务为中心转变,在此过程中IT运维侧需要共同发力,协同作战。

02. 什么是智能化敏捷运维体系

首先我们需要了解什么是敏捷,一般性的定义是:敏捷是一种通过创造变化和响应变化在不确定和混乱的环境中取得成功的能力。

ITIL4给出了更详细的定义:即一种框架和技术集合的总称,它们共同使团队和个人能够以协作、优先排序、迭代和增量交付以及时间盒为代表的方式工作。有几种特定的方法或者框架被归类为敏捷,例如Scrum、精益和看板。

1. 我们在运维层面该如何理解敏捷呢?

就是从“计划驱动”转向“价值驱动”,从“我”的视角转化为“业务”的视角。具体来说,就是从原来的“我要干什么”,“我想干什么”转为“业务想要我干什么”、“应用系统需要我干什么”,为了保证业务流转的高可靠、低风险、及时性,“我应该干什么”。(扫描文末图片二维码,立即申请试用!)

敏捷化不是具体的技术,是运维体系建设和运营的方法论,敏捷本身意味着持续迭代、持续丰富、没有尽头。敏捷不仅在DevOps应用广泛,在ITIL也需要使用到敏捷。现在很多单位和企业不断的提到运维开发,提平台化运维模式,正是因为已经意识到过往的买个产品三五年不需要操心的时代一去不复返。

2. 敏捷化运维模式下的最远目标:AIOps

智能化的敏捷运维体系,指的是向着智能化不断演进的敏捷的运维体系。智能化敏捷运维,是嘉为蓝鲸认为最适合金融行业未来三到五年的运维模式:以业务和客户为中心,以智能化运维(AIOps)为目标,以敏捷化方法论为建设和运营手段,两者相结合,持续演进与迭代,不断向AIOps演进和靠拢的过程。

▲ “智能化敏捷运维”的定义和解释▲ “智能化敏捷运维”的定义和解释

参考ITIL4里的定义,企业运维体系有四个要素:组织与人员、信息与技术、价值流与过程、伙伴与供应商。通常来说,关注较多的是前三个。

围绕建设企业敏捷运维管理体系,拆分下来最上层为价值流与流程,关注以业务运维价值为核心的敏捷运维管理实践;其次是信息与技术,关注以智能化为方向、平台化为支撑的运维技术体系;最底层是组织与人员,关注以用户和业务支撑为中心的敏捷运维组织。

▲ 企业敏捷运维管理体系▲ 企业敏捷运维管理体系

银行智能化敏捷运维体系的建设横向是组织与人员,纵向是管理与实践,斜向上是平台与工具,从而实现平台工具、管理实践、组织模式的全面逐步转型。

敏捷运维体系是一个平台支撑的,场景全覆盖的端到端的自动化工具生态体系,如今已不再是从前那种买一套工具回来三五年都不变的模式了,因为业务、系统、环境都在变,所以体系的横向和纵向都需要具备一定的延展能力,才能满足需求的变化。

▲ ITSM体系和ITOM体系▲ ITSM体系和ITOM体系

尽管AIOps是我们希望达到的最终目标,但是就目前而言,AIOps在落地方面还有很大的挑战,因此建议此方向多做些尝试。比如:

  • 在自动化基本建设完成基础上,建议同步开智能化运维试点
  • 选取合适的场景,基于运维大数据分析及智能算法,实现场景的智能分析
  • 之后,逐步以“数据”和“模型”为核心,构建面向业务保障的更加全面的智能化运维体系
▲ 由自动化进一步迈向智能化▲ 由自动化进一步迈向智能化

在这里需要注意的一点是,过往运维团队往往过于强调运维工具的存在,将非常多的精力和成本投入在运维工具的建设上。这本身没有错,只不过需要从业务价值和运维体系价值出发,看待运维工具,才能更加全面合理。运维工具无论对于业务人员,还是对于领导层,都是无感知的,单单强调运维工具的建设,并不直接带来价值。也就是说运维监控工具本身不直接产生价值,只有工具融入到具体的业务、用户的IT服务管理过程和实践中,才能产生价值。这一点是过往被我们忽略比较多的。

除了技术和流程,我们还需要考虑组织。敏捷运维体系的组织形式就是以客户为中心,跨职能、端到端,对整体负责的敏捷组织。具体例子比如业务运维敏捷小组打破部门独立工作模式,跨部门组建横向运维敏捷小组,以执行端到端的业务运维保障与运营支撑。

▲ 敏捷运维体系的组织形式▲ 敏捷运维体系的组织形式

03. 如何建设智能化敏捷运维体系

综合各个理论标准,结合我们对金融行业的认知,金融行业的运维管理体系可以划分为四个阶段:规范化运维(1.0阶段)、自动化运维(2.0阶段)、敏捷化运维(3.0阶段)和智能化运维(4.0阶段),大多数企业目前都属于规范化运维到自动化运维的过渡阶段。

第一个阶段,各类工具都已经配备齐全,但是彼此之间相对独立,联动较少。

第二个阶段,通过ITSM的高速化、自动化的管理,连接外部的ITOM工具,实现业务的可用性与连续性。

第三个阶段,基本都是服务管理支撑业务的可用性与连续性,工具和数据都在后台。

第四个阶段,就是通过AI去实现业务流转,取代人的部分判断和决策,实现运维的无人化和智能化。

数字化转型早不再是纸上谈兵,现已经成为国家的政策要求、监管的要求,同时也是全行业共同努力的方向。因此打造智能化敏捷运维体系,对金融单位和企业都有着深远的意义。

1. 响应数字化时代号召,实现运维模式的数字化转型

金融业数字化转型是大势所趋,并不只有业务与开发团队需要进行转型,运维团队也要紧跟时代步伐,进行全方位数字化转型,不致落后。

2. 对接业务与DevOps,实现端到端的持续交付

随着DevOp理论和工具的成熟,业务开发团队正在进行从管理到工具链的全方位敏捷转型,运维由于缺乏系统理论指导,在运维体系建设方面是落后的,需要通过技术、管理、组织等多方面建设,迎头赶上。

3. 实现更加敏捷、优质、高效的业务系统保障与运营

以客户和业务为中心的敏捷组织,通过同一平台支撑的敏捷ITSM管理实践为中心,充分融合ITOM的自动化工具体系,能够实现更加敏捷、优质和高效的业务系统保障和运营管理。

4. 为迈向智能化做好全方位的准备

智能化的前提是全方位的端到端自动化,以及运维管理的敏捷化、线上化和结构化;打造敏捷化运维体系有利于做好智能化运维前夜的全部准备,随时迎接智能化运维时代到来。

Q&A环节:

Q1:银行专门成立了数据管理部来管理数据合规和整合工作,运维数据也需要进行数据治理,蓝鲸在这方面有哪些探索和实践?

A1:您好,感谢提问。数据治理目前已经有较为成熟的方法论和框架体系,运维数据治理也遵循一般的数据治理方法论,从企业的数据发展战略出发,到具体的数据管控、数据管理和数据应用的相关制度落地,构建企业内专有运维数据管理体系。进而通过对应的产品系统和项目建设,实现落地。

蓝鲸目前也正在将上述理念落地到运维数据的治理方法论和产品思路中,将在合适的时间面市,并与大家进行分享。

Q2:运维工具体系和领域划分、融合推进,是否有体系化的策略方法?

A2:如果是运维工具体系的推进,整体上需要上层领导的支持、中下层的执行相配合。具体来说分为三个步骤:

  1. 运维能力和工具蓝图梳理
  2. 基于单位现状,能力差距和工具差距比对。
  3. 实施路径梳理、评审与汇报。

在具体的实施路径层面,又大体可以分为4个环节:

  1. 运维平台先行。
  2. 基于平台,存量吸收,运维监管控场景覆盖。
  3. 运维管理制度与流程梳理,融合ITOM工具。
  4. 业务系统运维运营场景覆盖与支撑。

Q3:银行现阶段的监管要求还是传统的职能组织分工要求,怎么对接敏捷运维?

A3:首先敏捷运维包括敏捷化流程、自动化技术平台和敏捷化组织。这三者之前互相支持,但并没有必然的前后顺序。非敏捷组织情况下,依然可以考虑自动化平台工具的逐步建设,以及传统流程向敏捷流程的逐步转变。其次敏捷组织当然有助于这两者实现,但即便是传统职能模式,并不妨碍前两者的升级,因为对于所有团队来讲,流程优化敏捷、工具自动化的实现,都是会带来好处。

Q4:敏捷是趋势,但是目前要求还是D/O分离,开发不能碰生产,很多都依赖运维,工作量徒增。有什么折中的方法吗?

A4:我有以下建议:

  1. 建议先从各个团队监管控工具的自动化开始建设,先解决各个运维团队自己日常运维的重复和低效的问题。
  2. 再考虑团队间的协同以及运维工具的端到端、一体化。这里面有两种情况,一种是不需要管控审核的团队协同场景,可以基于平台直接打通工具间数据和操作执行,实现团队工作自动化串联;另一种是需要管控审核的团队协同场景,需要构建结构化的ITSM平台,来连接团队间工具,并实现审核.
  3. 这两块如果做到八九不离十,基本上日常运维重复工作量会降低很多。则抽出时间来,解决与业务侧、研发侧的协同效率和质量的问题,这就是进一步的事情了。

0 人点赞