任岩 大数据具有数据量大、形式多样、速度快、价值高等特征,大数据产业是围绕数据的生成、采集、存储、加工、分析、服务为主的战略新兴产业。我国数据存储规模增长迅速,据IDC统计数据显示,2013年到2019年,全球大数据储量增速每年都超过40%,2019年全球大数据储量达到41ZB(相当于440亿个1TB容量的移动硬盘)。其中中国大数据储量占全球储量约为23%,美国大数据储量占比约为21%,欧洲、中东、非洲数据储量占比约为30%,日本和亚太数据储量占比约为18%,全球其他地区储量约为8%,在数据储量上,我国已走在世界前列。数据储量是大数据产业中关键的一环,有了海量数据存储,才有可能在加工、流通、服务等环节研发创新和展开更多应用。
我国大数据产业规模发展迅速,2021年11月工信部发布的《“十四五”大数据产业发展规划》中指出,“十三五”期间大数据产业规模年复合增长超过30%,2020年超过1万亿元,逐渐成为支撑我国经济发展的优势产业。
随着大数据产业的蓬勃发展,数据应用深入各行各业,企业提升数据思维,通过数字化转型,运用数据进行管理和业务变革。在大数据应用取得良好效果的同时,数据及个人隐私泄露、被非法窃取加以利用的风险越来越高,数据安全在大数据产业内越发重要。2021年国家正式颁布了《中华人民共和国数据安全法》和《中华人民共和国个人信息保护法》,这两项法的实施对大数据产业产生了重要影响。所以我认为2021年是数据安全元年,数据安全产业得到蓬勃发展,大数据产业也能得到保障。
近年来,人工智能、云计算、物联网、5G、区块链等新技术发展迅速,行业应用越来越深入,受到资本青睐,不少公司获得巨额融资或已上市,如科大讯飞、商汤科技、阿里云、中国联通等公司成为各自行业里的翘楚。新技术的快速发展、应用和大数据息息相关,各项技术应用或生成数据、或存储、加工数据、或分析、服务数据,和大数据产业链各环节紧密协作,大数据产业和新技术融合成为趋势。我认为2022年在数据安全保障基础上,进一步融合新技术将有利于大数据产业健康、快速发展。
在技术融合方面:
1、大数据和云计算融合。数云融合成果显著,大数据基础设施上云趋势明显,政府、企业在云端的大数据应用占比越来越高,国内外主要云服务商已经推出了较多的大数据服务以满足用户需要。比如谷歌云提供的MapReduce或Spark服务,以及国内阿里云提供的飞天大数据平台、腾讯云提供的数据湖分析服务、华为云提供的智能数据湖FusionInsight等,为用户提供了专业的大数据服务,企业及个人用户减少了对大数据基础设施的投入和运营维护,只需要关注业务逻辑和数据的应用,降低了用户学习和使用大数据的门槛,也降低了初创企业进入大数据产业的难度,有效支持了大数据在各行业上的应用。大数据和云计算平台的融合将进一步深入,云计算平台可能推出更多的大数据服务。
2、人工智能和大数据融合。数智融合受到广泛关注。一方面大数据平台融合人工智能,进化的越来越智能。大数据平台拥有海量数据,人工智能需要海量数据学习和修正算法模型,两者相辅相成,人工智能使大数据平台智能化,大数据平台通过海量数据让人工智能更精确;另一方面人工智能让数据治理智能化。大数据的数据量大、形式多样为数据治理增加了难度,人工智能可以对数据自动识别、分级分类、清洗分析及标识标签,生成优质数据,优质数据又为人工智能应用提供了数据基础。
3、大数据和区块链融合。区块链技术发展迅速、应用广泛,目前已在金融、供应链、信息安全等领域取得很好的应用效果,具有去中心化、透明性、信息不可篡改、匿名性等特征。区块链的技术能够在一定程度上解决数据确权、数据垄断等问题,打通企业及行业间数据孤岛,为大数据交易提供助力。大数据交易和使用过程中,身份认证、数据脱敏、隐私计算等安全问题也可以通过区块链技术得以改善。
在行业应用融合上,大数据促进了跨行业的应用和数据融合。以养老行业为例,养老行业在我国属于朝阳行业,随着我国老人人数的快速增加,老龄化问题日益严重,目前养老行业主要以政府统一规划、补贴养老金,企业提供固定的养老服务为主,市场化购买养老服务为辅,提供的养老服务偏向于家政服务,以上门清洁及少量护理为主要内容。一些政府和企业已经开始试点增加新的养老平台和服务,企业搭建养老大数据平台,通过对老人家庭的适老化改造,增加传感设备,采集老人健康数据、生活行为等数据,再通过大数据分析主动为老人提供体检、就医、采购等服务,以及发生紧急情况时的主动救援,如老人在家摔倒,后台通过摄像头等设备识别后主动触发救援,主动服务有效地补充了现有被动式的呼叫服务,提升了养老服务质量和效率。通过大数据融合了老人家庭的养老、医疗、消费等数据,拉通了养老、医疗、零售行业。其他行业也是如此,大数据有数据为生产要素,促进了跨行业的应用和数据融合。
大数据产业的深度融合使得数据交易频次大幅提升,跨行业的数据使用越来越多,随着人们对个人隐私重视程度和数据资产价值的提升,数据安全越来越重要。目前数据安全存在以下问题:
1、重视程度不足。目前部分行业或企业对数据安全没有足够重视,一些企业并没有设立数据安全的直接责任人,也没有对应的规章制度进行数据安全保护,对数据的使用以经济收益为直接衡量标准,容易造成数据的非法获取和滥用。一些企业和个人由于长期的习惯导致对个人隐私不重视,主动或被动地泄露了个人数据,造成数据安全风险。
2、技术风险。当前各大互联网平台已经拥有海量数据,如阿里、腾讯、美团等,从不同维度拥有个人数据、交易数据、行为数据、行程数据,而这些平台的设计是以行业应用为主,并非专业的数据安全系统,很多采用开源技术,本身就存在漏洞,如Hadoop平台从2013年到2017年暴出了18个漏洞。平台本身涉及数据采集、存储、加工、分析、服务等多环节,数据安全防护难度高。黑客攻击随着技术的革新,手段多样化。技术风险成为数据安全的重要风险之一。
3、管理风险。大数据由于数据量大、形式多样以及应用环节多,从而增加了数据管理的复杂度。数据量大、形式多样为数据的真实性和完整性校验带来困难,难于识别错误、虚假及恶意的数据,如果被黑客入侵,并注入虚假、错误数据,破坏了数据的真实、完整性,故意将数据分析、使用的结果导向其他方向,则数据分析结果将被操控。数据应用环节多,流动路径复杂导致数据溯源困难,也增加了数据安全管理难度,大数据从产生到应用服务及归档销毁,不再是单一组织内部应用,将会从单向流动变为多向流动,从一个使用者变为多使用者,那么会使数据的确权、溯源以及路径标识变得复杂,安全风险会更大。
针对以上问题,我认为可以从以下方面思考:
1、提升重视程度。国家层面已经制定了相应的法规,各相关部门、地方政府及行业企业应该根据法规尽快制定对应的细则,并按要求实施。企业应明确数据安全责任人,参照法规制定企业内数据安全制度并落实到岗,提升企业数据安全意识、个人信息保护意识,注重隐私防护,避免数据滥用。
2、发展和应用新数据安全技术。行业和企业平台引入数据安全技术加固现有的应用平台,重点关注数据防泄露、敏感数据识别、数据加密、数据脱敏、匿名化算法等技术,通过新安全技术和方案的应用降低现有平台的数据安全风险。
3、加强安全规划和管理。大数据正成为社会经济增长的新引擎,大数据安全逐渐提升至国家安全层面,数据安全规划也应从总体安全高度,构建大数据全生命周期的防护体系,提升大数据平台自身防护能力。同时建立健全安全组织,在提升安全意识的前提下,按制度切实落实行动,加强安全管理,通过管理和系统工具的结合为数据安全提供保障。
大数据已成为国家基础性战略资源,是推动经济发展转型的新动力,在数据安全基础上,和新技术的深度融合将有利于大数据产业快速发展。
关于任岩:
任岩,南京新百CIO,曾担任宏图三胞CIO,近20年的企业信息化建设和管理经验,经历多家大型零售、制造企业,有丰富的零售、制造行业经验。近年来积极推动企业数字化转型,对企业大数据应用有较多的实战经验。