本文内容整理自《数据安全与数据要素治理研讨会》中,中国电子信息产业集团党组成员、副总经理陆志鹏所做的主题演讲。
数据安全和数据要素化是当前的重要话题,但同时又是两个不同的研究领域。从2020年底,中国电子与清华大学围绕数据安全和数据要素化展开了联合研究,今天我就其中一部分研究内容和成果给大家做报告,从数据安全领域谈一谈当前面临的形势、解决问题的思路和解决方案,请大家批评指正。
党中央高度重视数据安全。2017年习总书记就强调要切实保障国家数据安全,2020年提出在“保障国家数据安全”的同时需要“加强个人信息保护”。之后出台的一系列中央文件和总书记的讲话都多次强调,既要保护数据安全,又要加强数据的开发利用,促进数据流通。我们研究发现,数据安全既与网络安全、信息安全密切关联,又有本质区别:数据安全是继网络安全与信息安全之后一个新的焦点与核心,是基于网络安全和信息安全新时代国家安全的战略支点与核心内涵;三个安全在涉及范围、管控对象、重点环节、技术特征和安全策略等方面各有不同。
数据安全已经成为当前大国博弈的主战场。从国际发展趋势来看,一方面美国国防战略在近几年已经由网络安全开始转向以数据资源为核心的安全攻防体系。反观我国,在数据安全领域正面临着基础设施、数据资源和技术产品全面受制于人的挑战。近些年来,我们国家数据基础设施频繁遭受海外攻击,数据泄露风险逐渐增加,数据跨境也存在重大隐患,给国家安全和人民群众的隐私保护带来巨大的负面影响。另一方面数据的存储和使用分离也成为企业满足安全合规要求的新举措。很多互联网企业将本地产生的业务数据交由数据服务商存储运营或托管运营,实现数据托管与产品运营在一定程度上的分离。例如美国的Tik Tok就将数据交由Oracle开展托管运营。
为有效化解当前的数据安全风险,经过体系性研究,我们发现数据安全和数据要素之间面临着“零和困境”。所谓零和困境是指:强调数据安全,数据要素就很难流通;反之,强调数据的流通,数据安全就无法保证。为此,我们定义了数据元件和数据金库两个产品,提出了以物理隔离、数据托管和模型转换实现存用分离的破题思路。
物理隔离是破解上述零和困境的第一个举措。我们定义和开发的数据金库,是由政府主导和监管下建设的数据要素基础设施,与外网实行物理隔离,用于存储影响国家和区域安全、影响国家长期发展战略的基础数据,包含个人隐私的核心数据和重要数据,以及通过治理形成的数据元件,为国家对数据资源的安全管控奠定了坚实基础。
数据托管则是将政府确定的核心数据、重要数据,个人隐私数据以及数据元件托管在数据金库中,实现“关键数据入库,双向风险隔离”。数据金库内的数据只有经过加工形成数据元件,才能到外网进行交换使用。与此同时,通过对数据资源、数据元件和数据产品进行三级安全管控,使数据安全得到有效保障。
模型转换是指把数据金库里的数据通过模型建模,加工成数据元件,经过单向网闸进入外网,在外网形成数据元件流通网络,从而实现数据要素的安全和高效流通。数据元件具有安全和价值两种属性。其中,安全属性是指数据元件将原始数据和数据应用进行隔离,实现了数据泄露风险和模型滥用风险的双重风险隔离。同时,依靠对数据元件的安全审查,实现精准监管。数据元件的价值属性在于它的可确权、可定价、可计量和可流通,从而解决了数据要素化问题。
基于上述思路,我们提出了如下解决方案:
首先,建立基于数据元件的全生命周期安全管控体系,涵盖从数据采集、数据归集、把数据加工成元件,再到元件进入外网流通。围绕这一过程,我们完成了21个工艺流程的设计。当前,正在开发数据要素加工交易中心。这一大规模、全流程自动化的数据元件加工生产流水线,能够实现数据要素从数据归集到数据元件加工交易的全生命周期利用和管控。从下图可以看到,该系统包括一个数据要素操作系统和五个支撑系统,并配有五大工具箱和五大业务平台,以数据金库和算力中心提供存储和算力支持。
其次,构建兼顾安全与效率的双层基础设施运行体系,以满足原始数据不出域、数据可用不可见的数据安全治理与要素化流通需求。从下图来看,底层是数据安全存储与要素化加工系统,用于数据存储和元件加工;上层是现有的云和互联网,经过要素加工系统加工形成的数据元件进入上层互联网和云中进行流通,支撑云上丰富多样的应用。
最后,构筑“一库两网,三级节点”的数据安全基础设施网络。在数据金库内网实现数据的交换和共享,通过数据要素加工平台将内网金库中的数据加工成元件,流入数据要素外网,在外网实现元件之间的流通以及元件和一般数据的融合,给各类应用提供数据支撑。通过对数据和数据元件进行分类分级、分层分布存储,统一设施建设标准,明确管理责任,最终实现数据归集、存储和流通的全程可管可控。
以上是我本次的报告内容,请各位老师、各位专家、各位朋友批评指正!