数据智能产业创新服务媒体
——聚焦数智 · 改变商业
市场上“中台”概念满天飞,一切早已经不再新鲜!
早在2015年阿里去欧洲公司SuperSell参观后,便在中国提出了中台战略,随后数据中台、业务中台,技术中台等这些词也被顺势创造出来。如同2013年被称为大数据元年、2017年被称为人工智能元年一样,中台在2019年迎来了自己的元年爆发。
据不完全统计显示,2018年数据中台的百度指数还在120徘徊,2019年春节后便涨到了300,仅到2019年年中,数据中台百度搜索指数就已经达到2018年全年的4倍多。
可本该大展拳脚的数据中台,并没有高开高走,而是由于概念模糊不清、各种产品鱼龙混杂,人们为了兜售自己的产品,不断曲改中台实际内容等等原因,让中台的发展路线不但没有像大数据、人工智能一样高歌猛进,反而背负了种种质疑。
近期,全球知名研究顾问公司Gartner在最新的《2021年中国信息通信技术成熟度曲线(Hype Cycle for ICT in China, 2021)》中,也是保留“数据中台”,但却去掉了“中台架构”这一概念。此次,Gartner研究总监孙鑫在接受媒体采访时,针对此情况对数据中台面临的挑战、需要的解决方案,以及未来发展方向进行了解读。
Gartner研究总监孙鑫
观现状:数据中台对于中国客户格外重要
现在市面上大多数对“数据中台”的解读,是来自阿里的:在大数据时代下,通过数据技术对海量数据进行采集、计算、存储、加工,同时统一标准和口径,具有数据治理和资产分析能力的,提供数据服务方式多样的企业级数据仓库与数据湖。
“数据中台是中国本土IT互联网公司首先提出来的,国外并没有中台这个词,那么数据中台的价值到底在于什么?数据中台为什么对于中国企业格外重要呢?”孙鑫表示这才是很多企业对于数据中台关注的核心问题。
过去十几年,中国的互联网生态迅速发展,支付、物流等基础设施重构,电商、营销等也发生改变,这让企业积累了大量外部消费者数据,并且迅速催生了一套新型运营方式。
与飞速发展的互联网圈形成鲜明对比的是,传统企业接受新运营模式程度差,新企业野蛮生长的同时,现有IT系统无法支撑新的“互联网时代”需求。
孙鑫表示:“其实,我们可以看到很多企业已经对自己的数据做了非常广泛的投资,这些投资可能会涉及数据湖、数仓,以及各种各样基础的数据建设。但他们却没有产生非常理想业务的价值。问题在于,企业可能在自己的数字化进程中采购了‘交易型的数据库’、‘分析型的数据库’、‘数据湖’等产品,但在往‘云’上发展的过程中,各个系统的数字化进程不一样,所以对于数据分析、数据库、数据资产本身投入的顺序也不一样,长此以往,数据就产生割裂,其实是更不利于发展的。”
现在,企业普遍使用的ERP、CEM更侧重的是内部管理和协作,不擅长处理海量的来自消费者、上下游合作伙伴的外部数据。
部分企业为了跟上各业务线外部数据处理需求,往往会陷入病急乱投医的情况,企业大量采购不同工具来处理数据,而各工具之间的壁垒也导致很多数据的循环利用性差。工具的五花八门制约了企业对数据的全盘打通,不利于资源和业务协同。再加上以往的管理或数据系统,稳定性高的灵活性差,灵活性高的稳定性又不尽如人意等等原因,让很多企业想打造数据中台来进行连接,企业希望通过自己已有的数据分析投资、数据资产产生一些价值,做出以数据驱动为基础的数据中台这种新型商业运营系统。
“Gartner在2020年第一次发布了对于‘中台’的市场成熟度或其市场渗透率的报告,把它称之为‘技术成熟度曲线’。数据中台是在‘技术成熟度曲线’的炒作的顶峰时,大量厂商在用这样一个名词售卖自己的产品。”
孙鑫还告诉数据猿:“有些厂商可能本来是做数据库的,说自己是做中台的。有些本来是做前端商业智能平台的,也说自己是做中台的。市场‘炒作’的声音非常响,对于真正需要的客户,反而在这个喧嚣的市场中找寻真实有效、可以解决自己问题的‘中台’变得特别困难。”
看技术:数据中台真正需要的方案
过去企业决策时大多是“拍脑袋”,可现在大部分企业需要大量数据参考辅助。每一个小决策连接起来都会变成一个大决策。做决策因此不再是一个人的事情,而是一个团队的事情,这样就是数据智能化。
那么怎么做数据智能呢?数据中台能完成数据智能这个使命吗?
“理想化的数据智能是:第一,企业的数据、决策将会由更相关的小角色的决定而影响。第二,前一个决策会影响后一个决策,后一个决策会影响到更后面的决策,决策会变得更连续。第三,决策更具情境化。每一个部门、每一个团队所拥有的业务属性是不同的。企业不再可以通过一个‘一码通吃’的模型进行决策,所以需要通过更具情境化的分析能力进行辅助。”
孙鑫表示数据智能化的情境对中台也提出了更高要求。它是否能够连接更复杂的数据源?是否能够根据用户需求给予更具情境化的数据?是否可以根据用户需求,以更连接的形式、更连续的形式、更快速的形式,给予决策者想要的数据?这些都对中台的要求越来越高,也正因如此,Gartner首次提出了组装式数据分析架构。
“组装式数据分析其实是有一个基础的,就是数据编织。这个数据编织是帮助企业织起一张虚拟的网,对企业所有的数据进行虚拟化。但这个虚拟化不是单纯地把数据关联在一起,而是更具情境化地利用知识图谱的能力对数据进行编织。这个编织会涵盖每一个数据消费行为相关的信息,这些数据消费行为是企业的元数据。这个知识图谱也不仅仅建立在企业的数据本身、而是建立在这些数据消费行为上。而且,如果企业想打通不一样的系统,也可以使用数据编织。它并不是要把数据全部收集在一起,而是对数据进行更好的关联、从而能够服务不同用户,帮助用户在合适的时间获得合适大小的数据,并且根据用户需求来及时提供。”孙鑫具体解释道。
侃未来:数据中台的新方向
“组装式数据分析正在塑造数据分析应用的未来。”孙鑫斩钉截铁地表示。
底层依赖于Gartner提到的数据编织设计模式,上一层是企业已购买的类似于“报表平台、分析工作站、自助式分析平台”或“数据科学平台”,未来的用户体验不再是这些技术平台,而是能力平台。这些能力平台被“微服务”容器化,它高度的开放性确保用户“上”到中台后可以得到一个组装式体验,用户未来只是说“我需要什么样的能力,然后在中台上找到,再后对能力进行组装,从而完成各自业务领域想要的数据产品或分析产品。
并且“组装式数据分析”会涵盖一个概念——DevOps。随着快速搭建应用或快速建立数据产品需求的上涨,企业可以把DevOps实践放到数据相关的应用上,把自己过去从应用开发中用到的一些实践,如版本控制、持续集成、持续开发这种能力,放到数据相关的应用开发中,这样可以让用户快速地从测试阶段走向生产阶段。
至于如何利用Gartner提出的“组装式数据分析”来完善中台的建设?孙鑫则是简单分享了几个较有意思的中台演进技术。
首先是知识图谱。知识图谱本身就是以业务视角来关联数据的,它的数据存储方式是以“点”和“边”的形式。以业务视角关联数据、建模数据,是传统的关系型数据库做不到的,但应用知识图谱就能找到业务之间的关联,做到让数据找到用户,而不是让用户找到数据。
其次是数据中台语义层。过去企业建立自己的中台或数据管理模式是比较偏IT的。但现在由于拥有了“图”的能力,企业可以对各个领域的业务含义进行关联。用户也可以通过更具情境化、更具业务化的方式找到自己的数据,并且通过这样一个业务相关的建模来统一数据交互的语言,这样有利于数据相关的创新。
据《2021中国中台市场研究报告》显示,未来五年,中台仍是我国企业数字化中的热点市场,年均复合增长率达到60%,2025年有望达到944.8亿元,所以中台的故事也许远远不止于此。
文:达尼亚 / 数据猿