你的公司比你还想用好你产生的数据,尤其是当你在全球有着超过18万名同事的时候。这个数字大致是华为在全球的员工数量。
在业务遍及全球的华为,超过18万名员工对应了每年300万人次的差旅,每一次差旅都会从多个维度产生数据。
在许多公司里,这些新生的数据会流经十几个申请流程,从交通、酒店预定,到考勤报备,再到费用报销等。如果没有实习生的热情协助,走完全部流程可能就需要耗去以小时计的工作时间。
可惜的是,这些数据和时间都不创造价值,相反,它们只对应了成本——不会有哪家公司乐意为员工贴发票的时间支付薪酬。
但是,用好这些数据就不一样了。
如今在华为,这些数据每天都会在后台关联和碰撞45万次。这种后台的变化催生了一个所有公司员工都梦寐以求的情景——随时来一场说走就走的——出差,复杂的流程不见了,他们只需进入一个流程就可以全部搞定一切。
这看起来像是一个智慧政务的“企业版”。在日前深圳举办2019全球数据基础设施论坛中,华为Cloud & AI产品与服务总裁侯金龙说,通过数据运营,华为实现了“让数据多跑路,员工少跑腿”的目标。
华为Cloud & AI产品与服务总裁侯金龙在大会上发表主题演讲
这是一个企业从数据管理走向数据运营的典型事例。在轮廓日渐清晰的智能世界,借助数据运营实现企业流程简化正变得再正常不过——同样借助数据运营,企业还能获得更多。
快手每天产生超过1亿条内容标签,并能够用户画像进行实时匹配。这意味着当用户点开一条视频时,用户所展现出来的“兴趣”就已经开始影响下一屏即将展现的内容了。如果要问数据运营如何影响客户体验?那么这就是答案。
更值钱的数据运营发在生产经营活动中。
大港油田被称为祖国东部的石油小摇篮,历史上,它“孕育”了中国的华北油田、渤海油田和冀东油田。但这个摇篮在持续摆动50年后日渐枯竭,产量开始下降。
2019年,华为的大数据和AI技术被引入了油田的数据运营。奇迹在此后发生。通过数据运营,大港油田陆续发现了更多的新油气层,并最终为企业长期稳产500万吨提供了决策支撑。
无论对于华为、快手还是大港油田,这些数据运营产生的价值都对应了一个个喜大普奔的现实,无论是欢乐还是金钱;但在更大范围内,情况就远没有这么乐观了。
根据预测,全球数据量将从2018年的33ZB快速增长到2025年的180ZB。但是目前,产生的数据中仅有不到2%被保存;而被保存的数据中,也仅只有不到10%被应用了。
道理很简单,保存和分析应用这些数据本身需要成本,即有财务成本,也有技术的成本。
“我们希望对数据的‘采、存、算、管、用’实施端到端的整合和优化,让数据在全生命周期内更好用,数据的每比特发挥价值最大,数据的每比特成本最优!”侯金龙说。
侯金龙宣布开源数据虚拟化引擎HetuEngine
华为在2019全球数据基础设施论坛中宣布了一项决策:开源其数据虚拟化引擎HetuEngine。开源版本被定名为openHetu,将于2020年6月上线。
侯金龙指出,对于开发者而言,openHetu的上线将让他们可以开源代码进行定制,包括数据源扩展、SQL执行策略等,并最终实现应用快速对接,并提升开发效率。
此前华为推出数据虚拟化引擎HetuEngine时,重点解决的正是“找数难、取数难和用数难”的问题,通过屏蔽数据类型差异、地域差异、语法差异,让数据治理和使用变得简单。
由于HetuEngine拥有“一个入口、一个目录、一份数据、统一安全”四大核心能力,因此它可以通过屏蔽数据基础设施的复杂度,让合作伙伴可以像使用“数据库”一样使用“大数据”,复用现有的生态、工具和技能。华为称,这将为开发效率带来2到10倍的提升。
openHetu是在企业用户期待获取数据红利的背景下推出的。由于这种期待的普遍性和紧迫性,openHetu事实上已经成为了一种代表——一种现代数据基础设施所必须体现的主要特征的代表——开放。
在今年9月的华为全联接大会(HC 2019)上,华为公布了“一云两翼双引擎”的产业布局,以及通过“硬件开放、软件开源,使能合作伙伴”来构筑开放产业生态的战略规划。
“一云”是华为云,“两翼”是智能计算业务和智能数据与存储业务,“鲲鹏 昇腾”则是那两具硕大的飞机引擎。那次会议中,华为基于其计算战略,已经开源了GaussDB OLTP单机版数据库和服务器操作系统EulerOS,它们的开源版本分别为openGauss和openEuler。
如今,在基础设施领域,因为“鲲鹏 昇腾”这两具引擎的存在,华为围绕数据构建起了完整的计算、存储和智能化等能力;它对应的数据基础设施包括了数据存储、数据处理、数据管理系统、数据虚拟化引擎等构件。
除数据虚拟化引擎openHetu所代表的“开放”外,侯金龙指出数据基础设施还应具备融合、智能两大特征。
基于华为在存储、数据库、大数据等技术领域的突破,数据基础设施的“融合”预示了“四堵墙”的破碎——“存储内部系统墙”、“数据库与存储链路墙”、“大数据与存储配置墙”,以及“数据库与大数据协同墙”。
对于应用海量数据抱有期待的用户而言,这种“破碎”直接意味着效益。根据华为的数据,它将可以降低30%以上的TCO、提升2倍的据访问和处理性能,以及实现分析效率100%的提升。
相比之下,“智能”这一特征则更容易理解——这是“鲲鹏 昇腾”的本能。毕竟,数据基础设施战略是华为计算战略的一个重要组成部分,而与之相关联的鲲鹏计算产业所能取得的成就,数据基础设施都理应“坐享其成”。