如何打造运维团队不可替代的“L”型价值体系-下篇

2018-12-21 10:58:51 浏览数 (2)

上一篇文章,我们在结尾提了两个问题:

  • 要真正做好运维保障和运营保障,究竟该如何做是好?
  • 除了基本的保障,运维团队和人员有没有更高的价值呈现?如果有,是什么?

不知道你是否有想到答案?

你也许可以听听腾讯蓝鲸对于两个问题的解答,或许能够帮你和你的团队拨云见日、一扫愁云,看清未来的方向和出路。

蓝鲸智云简介

蓝鲸智云,简称蓝鲸,是腾讯游戏运营部“腾讯智营”下的一个子品牌,是腾讯游戏运营部基于腾讯实际的异构化 海量的游戏业务环境生长出来的,集统一开发自动化、统一部署自动化、统一运维自动化、统一运营自动化、统一监控&自愈自动化等为一体的研发运营一体化平台。

它是一套基于SOA微服务架构的,基于PAAS平台 需求场景的研发运营一体化平台技术解决方案。

蓝鲸整体提供的服务层面架构如下图所示:

蓝鲸整体的技术架构如下图所示:

蓝鲸智云对于运维效率价值的理解

01

自动化阶段

运维基础工作自动化,“晚上可以好好睡觉了”

工具驱动运维:采用运维开发的模式,实现所有运维任务自动化、工具化、可视化。

借助蓝鲸平台的横空出世,实现人、脚本、web工具、任务调度编排、监控和故障自愈等全部的自动化运维任务在同一个PaaS平台上实现统一、整合和打通,彻底打通运维的“任督二脉”,让运维同事真正有了一种“先有蓝鲸后有天,蓝鲸在手虐神仙”的全局掌控感和安全感。

“点一下,就能走”式的无人值守是自动化运维这一阶段的终极归宿,运维终于能从基础的运维保障工作中抽身出来,专注于更加有价值的事情。

自动化阶段演进历程

蓝鲸平台丰富的自动化运维工具

全业务、多角色、全流程、统一外包工作模式

02

数据化阶段

“运维危机时代?不存在的。”

数据驱动运维:基于大数据的接入、存储、分析技术,对运维数据进行全面挖掘和分析,实现数据驱动自动化运维。

这个阶段主要依赖蓝鲸架构中的数据化平台来实现。

蓝鲸数据平台是蓝鲸体系中重要的一环,是一个专注运维领域的,使用门槛低的大数据平台。

提供以实时精准的决策为主,海量离线分析为辅的大数据服务。用户可以通过自助化数据接入,基于 SQL的计算配置,多场景异构化存储,以及多维度分析等功能,低成本、高效率的构建智能化、可视化的支撑工具和运营系统。

帮助企业发现业务数据的价值,辅助运维人员发现系统中可能存在的隐患以及挖掘应用系统中潜在的商机。

03

智能化阶段

运维真正步入AI时代

机器驱动运维:基于智能算法的机器自我学习,训练机器智能运维模型,实现无人值守和智能的运维与运营。

AI智能运维建模

提供最丰富的算法:包含特征工程、数据预处理、统计分析、模型、评估、场景模型等这一整套的机器学习算法节点。

一站式的机器学习体验:模型管理和模型部署,包括实时和离线应用让机器学习训练结果和业务可以无缝衔接。

通过蓝鲸平台,在效率层面实现由运维混沌状态质变为自动化运维阶段,进一步上升到数据化运维阶段和智能化运维阶段;在不断释放人力使其专注于更有价值事情的同时,在技术上确保了能够支撑运维实现更高的运维业务价值。

蓝鲸智云对于运维业务价值的理解

01

业务保障价值

将重复性的,由“运营环境”触发的基础工作,例如缩容、扩容、开区、合服、告警处理、故障处理等做成全自动化的无人值守,业务架构或者业务需求有变化的时候才去调整解决方案,这算是解放了应用运维自己,至少晚上可以好好睡觉了。

确保企业的包括基础架构和业务应用等对象在内的各种IT资源的稳定、可靠、高效的运行,这是运维的基本使命和基本职责,也是业务价值最低的职责。

在统一的平台上,尽量以最小的人力成本实现这个目标,释放人力关注更重要的事情;同时保障性工具本身要具备无线的扩展性。

02

辅助运营价值

将“人”(产品、策划、开发等)触发的工作,例如发布、变更、配置调整、日志或数据提取等工作封装成蓝鲸PaaS平台(又名蓝鲸集成平台)上的自助运营系统(蓝鲸的App工具),由产品自己操作或者转给外包操作。

这样既进一步解放了应用运维自己,也让相关岗位的同事不用再看运维脸色、等运维排期,自己就能随时做“产品运营”。

做到这一步,应用运维就算是切入业务运营核心流程了。因为越是竞争激烈的重点产品,在“运营”过程中越需要频繁的做重复性的、不涉及业务架构的功能或配置调整,例如改数值、改图片、上传加载新脚本等等,其实就是业务的“后台管理端”。

不同业务的管理端,功能大多各不相同,在过去往往是业务开发兼做管理端,自己找服务器、搭环境、写代码、部署。

最可怕的是产品用的不习惯,整天改改改改改……这对业务开发来说简直是噩梦!因为他们的本职工作(业务功能开发)不会因为一个管理端而减少,而且业务开发团队的人手永远是不够的,所以大多数业务开发团队都会让新手来做这类“永远做不完”的工作。

现在运维能干这类工作,而且不用考虑工具自身的高可用和运维(被托管的应用免运维是PaaS的基础属性之一),用业务开发的话讲,“现在的运维真是帮上大忙了”!

满足不同岗位差异化的运营工具需求,其实就是在落地企业工具文化,贯彻“能用工具的地方不用人,必须用人的地方要用工具辅助人”的工具文化思想。而其落地过程中必须解决工具的构建与维护成本问题。

蓝鲸智云内的PaaS平台(蓝鲸集成平台)通过aPaaS的运营时环境托管和iPaaS提供的云API体系完美扫除了阻碍运维团队实现企业工具文化的障碍。一个普通的应用运维,经过两至三周的培训就可以转型为运维开发,借助python这一大多数运维都可以接受的技术,华丽转身,实现辅助运营的价值。

03

运营决策价值

通过蓝鲸大数据平台和AI智能平台,实现全量运维数据和运营数据的采集、清洗与过滤、存储、分析以及接入应用,进而能够掌控整体业务运营现状,存在的问题以及问题的根源和原因,对应提出对策,助力运营决策,在各个维度拉升运营正向指标,甚至指引业务和运营的方向。

比如,通过各地的服务器日志实时分析用户的登录、注册、消费等各种指标,找出区域性的用户使用问题。

再比如,上了一个新功能,可以通过和研发约定的日志分析用户的使用情况和各种用户行为,或者为了某个营销活动或者新版本,临时的专项设置一些精细化监控,或者为了定位某个问题。

应用运维一般来说都是对口服务某个业务的,对自己的业务形态以及对从用户的角度如何使用都很熟悉,这就决定了:运维是可以理解产品运营策略的,也有能力推测出哪些数据经过怎样的处理,是有辅助运营价值的。

蓝鲸数据平台的出现,降低了运维使用大数据的门槛,直接推动了“运维增值服务”的拓展。

从应用运维“岗位价值”的角度来说(我们认为一个岗位的价值可以从被其他岗位替代的成本来衡量),当蓝鲸体系将应用运维武装到第三个阶段,就算是逆天了。

运维业务价值总结

如果说第一个阶段的运维业务价值—运维保障,开发等团队可以通过IaaS的高弹性(现在还不大靠谱)及业务架构的高可用(假设他们做得到)轻松替代的话,那在第二个阶段—辅助运营,就要付出一些成本了,毕竟是硬性增加了开发团队的建设及维护工作量。

而在第三个阶段,要替代运维,对业务开发来说就太为难了。应用运维们借助蓝鲸数据平台可以大量进行业务开发团队从成本上难以承受的工作——运营环境大数据分析,来进行产品运营的决策辅助。

被切分成不同产品线的业务开发很难各自搞一套数据平台,而合并到一起的专业数据团队即使在分析营销数据之余还有精力,也难以同时具备理解业务用法、掌控业务数据与运营环境数据、熟悉产品运营思路三个要素,只有应用运维同时拥有这三种属性。

所以,业界当前在担忧的运维危机,将不复存在。

蓝鲸智云,打造运维“L型”价值体系

蓝鲸智云从两个维度打造运维的“L”型价值体系。

01

横向,运维效率价值层面

依托于蓝鲸平台的管控平台、配置平台、作业平台、自动化编排引擎、集成平台,助力企业逐步从传统的混沌运维状态质变到自动化运维阶段;真正释放人的生产力,专注于更有价值的工作。

借助于将在2018年6月释放的数据平台和相关核心技术组件,由自动化运维阶段上升到数据化运维阶段;在这个阶段,运维已经能够通过大数据分析辅助运营,甚至提供部分运营决策。

借助于未来即将释放的AI挖掘平台和相关核心技术组件,通过智能算法训练机器运维模型,在接入运维大数据的基础上,实现智能化运维阶段;进一步切入业务运营核心流程,彻底放大运维的价值和不可替代性。

02

纵向,运维业务价值层面

运维业务价值层面的提升需要依赖于运维效率的提升而逐步实现,自动化运维阶段将基本完全替代人肉完成运维保障层面的工作,把基础保障的繁多、细琐的运维流程交给平台可靠、高效、自动化的完成,让人关注更有价值的事情。

借助于数据化运维的实现,运维的业务价值进一步上升到能够通过技术支撑和大数据分析拉升对内对外业务运营指标,优化用户业务体验,辅助业务运营的阶段。

在智能化运维的阶段,运维力量彻底从底层运维保障得到释放,全面介入对内对外业务运营指标的提升,为业务运营决策提供全面的技术支撑和数据支撑。

运维综合价值

纵向的运维业务价值,需要依托于横向的运维效率价值的实现,需要依托于像蓝鲸这样的提供强大的平台能力和强大的运维场景扩展能力的解决方案;

而纵向的运维业务价值提升,将直接提高运维团队和人员在整个IT中的价值地位,甚至是在公司中的整体价值地位,有利于企业投入更多资源实现IT整体阶段和能力的进一步提升。

两者的整体水平,决定了运维对于企业的综合价值,决定了企业如何看待运维,如何使用运维的力量,以及对于运维的资源投入。

对于能够借助于蓝鲸这样的强大平台力量,在两个方向持续上升的运维团队来说,有何“运维危机”可言呢?

不仅没有危机,运维未来的光明方向几乎就在眼前:

  1. 运维保障成了最容易完成的工作,在此之上,运维真正成功转型运营,持续为企业贡献“辅助运营”和“运营决策支撑”等高层次的价值;
  2. 企业将越来越倚重这只已经逆天的、再也无法被轻易替代的运维运营团队的力量来支撑、拉升自己的整体业务水平;
  3. 同时企业也将心甘情愿投入更多资源来建设这只“有价值”的团队。

对于主动探索出路和尝试新的技术和解决方案的运维团队来说,“危机”是永远不会存在的。

愿所有的运维最终能告别苦逼,实现自己的真正价值。

备注:本文部分内容引用《腾讯蓝鲸如何打造出无可替代的运维团队?》

0 人点赞