从信息化时代到互联网时代,再到如今大幕初启的数字化时代,IT、互联网和移动化已经渗透到工作和生活的方方面面。今年早些时候一群歪果仁评选出中国的新“四大发明”——高铁、网购、支付宝和共享单车,后三样都是来自于IT变革。而运维作为IT运行的有力保障,在不同时期和不同类型的企业中正在发挥着越来越大的支撑和引领作用,今天就让我们聊聊信息化时代的传统运维、互联网时代的互联网运维和数字化时代的业务运维有什么不同!
传统运维
在信息化时代,企业所购建的各种信息化系统如财务、供应链、进销存、ERP、OA等等,多是为了满足内部管理的需求。这些系统面向企业内部员工或上下游产业链,无论是用户规模,还是功能需求通常是集中、可控和固化的。因此信息化系统的开发设计都是烟囱式架构,纵向扩展能力强,横向扩展能力弱,系统内部重度耦合,而系统之间无关联或弱关联。这就造成了一种现象——信息孤岛丛生。
传统运维部门在制订IT设备和信息化系统管理目标时,关注的是一台台IT设备的故障率和一套套应用系统的可用性,在基础设施、数据库、中间件、灾备、存储等环节通常大量采用商业闭源的软硬件产品及其解决方案,设备的开放性差、标准也不统一,管理时遵循严格的ITIL管理体系,喜欢采用两地三中心这种典型的重量级、集中式运维管理方式。
随着IT规模越来越大、系统越来越复杂,运维保障工作由最初的硬件运维不断细分,网络工程师、系统运维工程师、DBA、安全工程师等岗位加入到运维体系中,系统管理采用各种重耦合的ITSM、ITOA软件,如IBMTivoli、HPOpenview等。
当业务系统发生故障时,IT主管首先召集自扫门前雪的各个运维岗位进行自检,查看各自负责的设备、应用组件、系统是否运行正常。如果没有发现问题,则会召集设备提供商、系统开发商、系统集成商,甚至是IT咨询公司一起对系统进行“会诊”,查找故障原因,整个流程常常会超过一周时间。
所以,传统运维部门常常被称为“救火”队员,依靠人工巡检的工作方式,不但工作被动,而且效率低下。
互联网运维
到了互联网时代,一切以互联网为核心,IT的边界被完全打开,IT系统不再是为企业内部管理提供支撑,而是为亿万互联网用户提供各种线上服务。因此,IT部门成为了互联网企业的核心,而保障线上业务持续、稳定运行,也是互联网企业的第一使命。
由于互联网业务通常要面对来自世界各地的互联网用户,这些用户的上网方式、终端设备千差万别,用户需求更是不断变化。同时,互联网产品迭代、变更非常频繁,业务规模增长迅速,传统商业闭源软、硬件产品无法满足互联网业务敏捷、高效的运行需求,弹性、扩展程度高的分布式系统成为互联网架构的首选,硬件通常使用廉价的X86服务器,应用系统则会选择便于二次开发的开源产品,这也为虚拟化和云计算的流行奠定了良好的基础。
互联网运维最关注互联网用户体验,重视响应时间、可用率等性能指标,常常会要求系统可用性达到四个九。因此,互联网运维在基础设施、数据库、中间件、分布式存储、自动化部署等环节通常大量采用开源或基于SaaS的自动化运维监控工具,如Zabbix、Nagios和云智慧监控宝等,这些产品的横向扩展能力很强,具有分布式、轻量级、模块化、去中心化等特点。
故障发生时,要求互联网运维能够第一时间发现问题,并快速进行根因分析,依靠人工巡检的传统运维管理方式严重落后,自动化运维逐渐流行。这就对互联网运维工程师的开发能力提出了比较高的要求,熟悉LAMP/LNMP、掌握Python之类的脚本语言只是基础,玩得转各种开源监控系统,能够根据业务特点和企业需求定制开发自动化监控和告警工具的运维大牛成为BAT等互联网巨头的追捧对象。
这一时期,运维和开发之间的边界变得模糊起来,DevOps成为互联网产品从开发到上线维护的新选择。
以大数据为武器,保障数字化转型成功的业务运维
过去,传统企业和互联网企业之间的界限泾渭分明,然而在互联网经济对实体经济的不断渗透和冲击下,越来越多的传统企业开始拥抱互联网,借助互联网 和数字化转型谋求商业模式创新。一方面,在过去的十几年里构建了大量信息化系统仍然为企业管理提供保障;另一方面,数字化业务必须满足互联网用户的体验需求,这就造成了传统信息化系统与互联网应用大量并存的局面,业务与IT管理系统之间存在着巨大断层,传统运维和互联网运维难以有效支撑企业的数字化转型。
于是,利用大数据技术消除业务与IT断层,解决数字化转型痛点成为IT运维发展的第一选择。业务运维是以大数据技术为基础,覆盖企业所有业务系统和IT系统的新一代运维大数据管理解决方案,通过全链路监控、端到端应用性能管理、实时业务数据分析与高度定制化的可视化大屏等手段,帮助企业第一时间发现业务数据波动,凭借根因分析准确定位造成业务问题的IT故障,持续提升数字化业务运营和IT管理效率。
业务运维关注的不再是单纯的IT系统运行状态,而是以业务运行健康作为核心指标,这就要求CIO所领导的IT运维部门对用户需求、业务运行有深入的了解,能够根据业务特点规划系统、调配资源、优化流程,进而实现IT引领业务的数字化转型目标。因此,业务运维必须具备强大的即时数据分析能力和开放的数据接口,能够接入各种ITSM/ITOA系统、APM、NPM和业务系统数据,而且业务运维与原因IT系统是松耦合、低侵入的,是可以弹性部署和灵活配置的,这样才能在企业的数字化转型中快速实现价值。
未来,随着机器学习、深度学习等技术的不断成熟,AI技术将在业务运维体系中得到广泛的应用,共同推动IT运维市场的进步,而这就是业务运维在几年之后发展方向——智能运维AIOps。通过不断的数据积累和持续学习,智能运维AIOps将把运维人员从纷繁复杂、过度依赖人工的监控、发现、告警和修复工作中彻底解放出来,而运维也将变得更加自动化、智能化。