随着中国数字化进程的不断加深,大数据产业或将再迎风口。
《“十四五”大数据产业发展规划》强调:数据是新时代重要的生产要素,是国家基础性战略资源。而目前,我国大数据产业年均复合增长率保持在25%,预计到2025年左右我国大数据产业测算规模突破3万亿元,形成创新力强、附加值高、自主可控的现代化大数据产业体系。
从《数据安全法》到上海数据交易所,过去的这一年,写满了数据的故事。
合规与流动,2021大数据产业的两大方向
在我看来,2021年大数据行业走向体现出两大趋势。
第一是行业在野蛮生长之后,终走向了合规。
数据安全问题场景众多,不仅存在于数量的环节,更是从数据的收集到处理再到应用的一整套链条。但在此之前,行业部分行为规范与管理框架并不明确,监管主体和市场主体关于数据安全保护的意识相对淡薄,行业框架较为模糊。
随着《中华人民共和国数据安全法》《中华人民共和国个人信息保护法》等法律法规出台,就数据应用与治理等层面做出了明确规范,推动行业走向规范健康发展。
而在合规浪潮下,行业对于合规的认知也逐渐提高,不管是收集环节脱敏,还是处理环节加密,亦或是应用环节不可逆等等,其实都是责任主体加强数据安全保护的应用措施。
虽然在法律应用初期,合规层面也会对部分企业业务带来一定的挑战,但随着行业发展,初期的不适应终将会被克服,变得越来越好,而数据安全行业或许也将成为下一个风口。
第二是国家层面明确定义了数据资产,并且有意识地去引导整个数据交易环节。
根据2021年IDC最新发布的统计数据,我国数据产生量约占全球数据产生量的23%,总体数据规模处于世界领先,数据也被国家正式列入生产要素。2021年7月,国务院发文明确提出“建设国际数据港和数据交易所,推进数据权属界定、开放共享、交易流通、监督管理等标准制定和系统建设”。
2021年11月25日,上海数据交易所正式揭牌成立。国家层面这一系列信号的释放,正是起步阶段极佳的探索方式,表明数据正在实现从资源到要素,再到资产与资本的转变,预示着数据应用将再上一个台阶。
确权、数据孤岛、人才,大数据产业三大瓶颈
就目前而言,大数据产业发展过程中存在着三大瓶颈。
第一,数据确权整体仍不够明晰,导致数据收集与使用过程存在局限。
经济学家哈罗德·德姆塞茨《论产权理论》表述:“产权的产生,本质上还是一个成本收益权衡的过程,只有当通过界定产权,将外部性内部化的收益大于从事这一行为的成本时,产权才会产生。”
在我看来,这个问题需要全行业共同探索,从而明确如何合理合法地收集与使用数据及数据权归属。只有明确上述问题,才能更好地实现数据应用,释放其所蕴藏的价值。
第二,数据孤岛导致数据流动缓慢。
众所周知,数据应用有两大关键因素:一是整体数据规模;二是数据的流动性。在当下的技术模式下,数据多储存于数据库中,但目前仍有许多数据库各自为阵,很难达到与日俱增的数据流动性标准,致使数据应用空间与场景受限,进而导致价值与效率大打折扣。
因此,一定要有可行方案来打破传统的数据库存储模式,从大数据交易所的建设与应用便能看出,部门协同是打通数据流动脉络的可行路径。
第三,大数据产业发展进入爆发期,人才缺口严重。
目前,同广阔的市场相比,中国研究基础技术、场景研究的人其实一直处于大量短缺的窘境中。
猎聘2019年大数据人才就业趋势报告显示:中国大数据人才缺口高达150万,而人才增长的速度仍难以补足人才缺口,远远达不到企业增长的需求。
而大数据产业也并非个别大厂能包揽之事,其应用场景众多,需要中小企业去研究与支撑。当下所有大数据相关企业都在不停地争抢人才,而如果行业人才全都流向大厂,那腰尾部企业就很难开展广泛应用场景的探索与研发,进而导致产业出现恶性循环,限制产业发展。
另一方面,人才培养模式也影响着技术、应用二者的融合,国内教育模式重知识、重技术,但却缺乏广泛的实践,难以应对大数据从水平领域往各垂直领域的延伸发展的需求。
基于此,加大融合人才培养、让高校学生能够更早参与到项目实践领域,对于技术的场景落地十分重要。作为研究储备力量的高校学生只有见过数据,使用过数据,才能建立对于数据、应用场景的感觉,从而更快地成为行业所需的人才。
“懂行”又“懂数”,释放数据价值
随着软硬件在政府的支持下取得了长足发展,目前国内基础设施构建也趋于完备,所以在数据收集、储存与处理等环节的难题并不会成为未来的核心问题。
由于数据应用领域里面算法大多为公开状态,大部分基础理论与技术研究都处于量变的过程,就目前来看,还没有到达质变的突破点。
今年伊始,受疫情影响,各行各业对于数字化升级的需求持续扩展。过去企业所考虑的往往是应用与否,而今年企业更多在寻找应用场景与明确需求。而大数据行业也在需求的推动下来到了百花齐放的场面,技术深入到了很多具体的场景应用层面,毕竟真正能引导行业发展的,是数据所创造的价值。
要释放数据价值,关键在于做到“懂行”又“懂数”,懂行就是我们要懂场景,懂这个场景里具体应用的方式和切入点,懂数是要懂得数据的收集、处理、应用以及场景化。
我们提出数智中台的概念,就是希望能够打造一个有快速多元的数据整合能力、乐高式的积木搭建能力和基于具体场景进行快速适配能力的数智平台。结合行业的变化,将数据处理能力和场景结合在一起,去解决实际场景的问题,这也是我们看到各行各业变化的核心点。比如我们基于政府部门安全场景提供的以大数据智能预警阻断为核心,集感知、研判、预警于一身的反诈预警系统,能协助警方打击防范电信网络诈骗犯罪,并通过大数据分析和机器学习,模型共创等方式,为更多地区警方的反诈工作提供线索,提升质效,配合监管部门筑牢网络安全基石。
所以从时间轴来看,大数据行业的突破和变化更多体现在应用层面,即如何通过现有算法能力同具体的场景更深入结合,进而解决场景所存在的具体问题。
未来,无论是大数据技术处理,还是数据应用,或是两者融合的解决方案,都将同过去移动互联网在社会生产环节中的应用一般,渗透进企业从前到后各个环节里面,成为决策支撑之一。
因此,现阶段大数据行业最大的问题其实不再是数据及数据应用的重要性能否体现,而是如何帮助企业更好地在更多场景下面实现数据应用。解决这个问题很难一蹴而就,需要企业在各场景不停摸爬滚打,打磨产品,进而加强技术与应用层面的结合与联系。