《数字化转型的本质》中,分享了数字化转型的三个阶段分别是数字化(业务流程信息化&线上化)、数据化、智能化,有了第一阶段的数据输入后,后面的两个阶段都是围绕数据展开,数字化转型想要最大程度地发挥其价值,比如要充分挖掘数据的价值。今天,就来看下在数字化转型的过程中,涉及数据工作的主要内容。
一、数据的全链路流程
业务数据化,数据资产化,资产业务化,概括了数据的生命周期过程,也可以用“采、存、算、管、用”来总结。
1.数据采集
数据采集是数字化应用的基础,数据采集能力不完善,数据应用就是无源之水,巧妇难为无米之炊。所以,在转型过程中,转型战略和路径一旦确定后,就要评估数据采集的现状,哪些是已经有的,哪些是需要补齐和完善的,哪些是无法获得的,无法获得的数据甚至需要调整已规划的转型路径。对应App&小程序等线上应用,数据采集主要是通过埋点采集,业务系统数据则是通过数据库存储。此外,对于智能设备或者其他的机器运行参数、环境监测等则需要通过传感器硬件的部署才能采集得到。
2.数据存储
大数据的4V特征之一是海量的数据,采集到的数据需要找个地方统一存下来,针对结构化、非结构化数据,需要都能统一汇聚起来,才能进一步加工应用,此外,在这个过程中,需要借着转型的东风,把过去的部门墙、数据孤岛尽可能打通。把数据统一整合汇聚起来。
3.数据计算
数据计算是将数据资产化的过程,有人说数据是原油,只有经过加工萃取提纯后,才能发挥其价值。数据集成汇聚后,就需要按照业务的应用场景进行清洗、加工和计算了。也就是通常说的数据ETL过程,而且,在这一建设过程中,需要提前规划好数据仓库架构,case by case的数据清洗和开发不仅效率低下,而且还会埋下一堆坑,未来某天暴雷了。
4.资产管理
有了一个个的模型,酒香也怕巷子深,想让模型尽可能地被复用,业务找得到,敢使用,就需要把模型进行资产化地管理起来。一方面要编排好资产的检索目录,就像图书馆的索书号一样,其次构建丰富的元数据信息,辅助决策判断是不是自己需要的目标数据。此外,还要考虑图书的质量问题。如果图书只增不减,那么图书馆总有负载饱和的一天,所以,还需要对图书借阅情况统计分析,定期做减法处理。
5.数据应用
前面的工作主要是基建工作,经济基础打好了,上层建筑就可以更高效地搭建起来。没有应用场景,数据资产就只是占用仓储空间而已。数据应用包括数据优化和智能驱动两大方向。数据优化主要是基于数据进行复盘决策,例如通过数据可视化把过去的定性决策全部定量决策,通过数据复盘业务过程,优化经营策略。智能驱动则是通过数据来赋能产品或运营过程,比如,通过用户画像找到更加精准的目标用户,为用户提供个性化的产品或服务,AI加持,催生更多产品创新。
6.集群资源
数据存储需要硬盘空间,任务计算需要CPU、GPU资源,对应的主要就是各种分布式集群或者云计算资源了。
二、数字化转型过程中,主要的数据工作内容
举个例子,数字化转型的数据应用过程就像大厨做菜。
想要做出美味的食物,首先要把各种食材准备好,但在物质匮乏的年代能吃饱就不错了,所以可能常见的就是些家常菜,土豆丝,土豆片,土豆块,土豆泥……想要做出108道满汉全席,还必须采集或者自己种植个更丰富的瓜果蔬菜。
有了食材开始准备做菜了,如果食材没有分类,采购回来直接扔到厨房地上,每个人都要翻腾一遍。翻箱倒柜地找到所需的食材也消耗大量时间。所以,需要把菜按照瓜、果、蔬、菜,冷热甜咸归类放到冰箱或者菜柜才能快速找到。
单个菜柜或冰箱的存储空间总有上限,如果同时有多个冰箱,就可以不断扩展了(分布式存储和计算集群),自己买太多冰箱有些浪费,供销社或者别人家的冰箱不用的时候我借用一下,我的冰箱不用的时候也可以租给别人用,实现空间的弹性共享,再也不用担心没地放菜的问题了。(这就是云计算了)
如果每一道菜都要择菜、洗菜,那做一道菜就要花很长时间,108道就需要很多个厨师同时开火,才能保障不耽误娘娘们用膳。所以,快的方式是专人负责洗菜、择菜,甚至刀工切菜,甚至这些工作可以提前准备,御厨直接根据菜谱和经验烧菜就可以了(数据中台的复用和共享)
想要菜做得好吃,一是厨师的厨艺要高超,阅览各种名家食谱,并且多年苦练才能习得一身好的厨艺。没有厨师的经验,再好的食材也是暴殄天物。
另外,除了大厨的手艺外,食材的质量,新鲜度、口感、安全性等也会影响最终的菜肴口味,因为食材质量问题导致菜不好吃或者做出了有毒的食物,说不定就要被拉到菜市口咔嚓了。
其实,数字化转型不是一个单纯的IT或者技术问题,也不是纯粹的业务问题。厨艺的核心菜谱和经验,原材料是食材,做菜的速度取决于食材准备的完备程度。任何一环缺失或者效率低下,都会影响最终做菜的速度和质量。所以,想要或者正在进行数字化转型的老板们,比对下当前来说,哪些数据工作需要完善或者补充人才吧。
篇幅问题,下一篇再介绍数字化转型所需的数据产品吧。