深度观点|数据要素流通的破局之道在何方?

2022-08-22 18:11:02 浏览数 (2)

8月5日,由腾讯云主办的链上产业系列活动第二期成功举办,来自深圳数据交易公司、北京微芯研究院、腾讯、开放群岛(Open Islands) 开源社区等机构的嘉宾围绕“区块链与隐私技术-数据要素安全流转”主题,进行了近三个小时的深入交流分享,精彩纷呈,干货满满。

如何打破数据孤岛?如何充分发挥数据要素作用?如何实现数据共享与可信流转?这场沙龙给了我们答案,快来一起听听专家的洞察。

深圳数据交易有限公司副总经理王冠在直播中带来题为《以开源方式促进数据可信流通》的分享,她从深圳数据交易市场的发展谈起,分析了以开源方式促进数据可信流通的重要性。

首先,数据合规、数据融合、数据资产化是数据交易的核心。为贯彻落实《深圳建设中国特色社会主义先行示范区综合改革试点实施方案(2020-2025年)》赋予深圳“研究论证设立数据交易市场或依托现有交易场所开展数据交易”重大改革任务,及《关于深圳建设中国特色社会主义先行示范区放宽市场准入若干特别措施的意见》中对于数据要素交易相关业务的市场准入要求,深圳作为唯一一座获得中央两次明文授权探索数据交易的城市,在深圳市发改委指导下,深圳数据交易有限公司(简称“深数交”),2021年12月于深圳市福田区河套深港科技创新合作区注册成立。

深数交肩负社会主义先行示范区培育构建数据要素市场的历史使命,把握国家大数据产业战略及粤港澳大湾区建设发展的重大机遇,积极探索央地协同机制,坚持合规发展和市场驱动原则,以建设国家级数据交易所为目标,构建扎根粤港澳、服务中国、面向世界的大数据流通市场。据不完全统计,深数交数据需求方占业务开展市场参与主体数量的57%,数据提供方为24%,数据商为19%。其中,从全国范围来看,深圳数据商居首,占比达到40%。

第二,关于数据流通的现状和挑战。如今,数据要素流通市场还处于发展期,主要面临四大挑战。一是数据安全挑战,基于数据的易篡改、易泄露、易流通、高价值等特点,在数据的托管、加工、流通、应用等环节,相应的安全管控措施较为薄弱。二是交易互信挑战,交易各方在交易发生前未建立良好的信任关系,需要具备公信力的第三方平台为数据交易过程中提供技术保障和监督管理。三是目前虽然国家已先后出台相关法律及政策规范,但是尚未覆盖全行业数据交易过程。四是技术实现挑战,多方安全计算、可信执行环境、联邦学习等隐私计算技术尚未形成成熟技术体系,需要进一步强化与发展。

第三,开源促进数据可信流通。开源作为一种新型协作生产模式,在推动科技创新和数字化转型方面将发挥积极作用。通过开源,可以使更多社会角色共同参与到推动数据要素发展事业当中;让技术在接受更多维度检验的同时,建立起更加敏捷、全面的反应机制;以场景需求为主导,推动事实标准快速形成,推进技术迭代、行业互联互通与产业发展。

腾讯云区块链产品总监邵兵在沙龙直播中带来了题为《区块链技术助力数据流转与治理》的分享,深度分析了区块链技术在数据治理中的趋势和应用情况。

首先,web3.0对数据的流转提出了新的要求。互联网从1.0、2.0再到3.0时代,其发生变化的实质在于对数据的掌控和管理,在 Web3.0 时代,用户倾向于用更彻底的方式保护数据隐私,也就是要能够实现数据所有权和价值的转移。随着应用的去中心化,链上数据可查的情况下,用户行为、产生的数据乃至应用协议等都需要隐私保护。

如今,数据隐私已成为全球监管的焦点问题,一方面需要我们强化法律保护,让使用者意识到盗用、违规使用数据是违法行为;二是引入技术手段如区块链、隐私计算,通过同态加密、多方安全计算、可信执行环境、密钥保护等技术,保证数据在使用过程中是安全可靠的。

其次,隐私保护的重点应该是在数据使用中尊重和保护数据主体的隐私权。而不是将数据独有权给予数据相关主体,否则难以发挥数据作为生产要素的价值,最终让所有的相关方受损。

第三,区块链与隐私计算是实现数据流转与治理的关键技术方案。通过安全、可靠、防篡改的技术体系提高数据的质量,通过存证确权、产权溯源保障数据的权利,通过隐私计算保障数据共享。

第四,区块链技术能够有效明晰数据确权、改善数据质量、有效衡量数据价值,并且增强数据安全和隐私。比如,数据确权是进行数据共享和价值变现的前提,区块链通过数字签名和时间戳,构建链上唯一身份标识,实现数据上链及确权,明晰数据权利人数据权属,当数据进行使用时,再进行二次确权,验证权属的完整和一致性,保障了数据在进行交易流通过程中的全流程权属认定。

最后,阐述一下腾讯云区块链打造的区块链与隐私计算相结合的产品数链通。它底层是区块链可信设施层,支持国产自主可控的区块链引擎长安链,然后是隐私计算层,通过可信执行环境、多方安全计算、联邦学习多种技术融合方式保护数据隐私,在功能层有目录管理、任务管理、模型管理、授权管理等,最终面向的用户有数据提供方、数据使用方、模型提供方等,可以面向政务、金融、医疗、工业等领域应用。

从实践来看,我们利用区块链与隐私计算,实现了气象局、水务局包括第三方公司之间的数据隐私计算,既保护了管网等隐私数据又保护了内涝预测模型,实现了数据不出门、数据不落地、数据可用不可见的效果。

北京微芯研究院隐私计算产品首席架构师周萌萌在沙龙中带来题为《数据要素流通破局之道》的分享,就数据可信流通的全生命周期,进行了深入浅出的分析。

首先,数据可信流通全生命周期的建设和应用。其中分为五个维度,从数据资源可信、交易流程可信、任务调度可信、计算过程可信、结果可信,从而实现全生命周期的数据可信流通。通过链上的交易审批,我们用区块链的技术保障了交易可信,而且是全流程链上审计。

第二,建立数据联盟至关重要性。隐私计算开发平台需要多方参与,需要建立起政务联盟、医疗联盟、金融联盟,从而保障在各个环节有通道和连接,实现整个生态的联动。

第三,隐私计算平台功能架构和保护算法。我们通过自研和合作研发的方式,打造了全套的架构和算法,从功能架构来看分为应用层、协作层、目录层、网络层。

微众银行人工智能首席科学家、开放群岛开源社区技术开发组专家范力欣带来《模型及数据的权属验证问题》的分析,从人工智能的角度,解析数据确权和数据使用诸多问题。

首先,关于模型版权(IPR)急需保护的问题。现实情况是,神经网络(DNN)商业价值巨大,攻击者可能盗取昂贵的模型,如果要追责,那如何验证对模型对所有权呢?

其实,现在已经有神经网络水印技术、神经网络白盒水印技术、神经网络黑盒水印技术、联邦学习模型版权保护技术、神经网络生成模型黑盒水印技术、基于秘密护照的神经网络版权保护技术、图像描述模型版权保护技术等等。

第二,关于数据的权属验证与保护。我的私有数据是否被非法使用了?这是目前大家非常关注的问题,现在我们有两个思路,一是基于模型应用的输出,来判断我的数据是否被使用了,二是进行预言性的判断,目前大量的相关工作已经展开。

第三,何为安全可信的多方分布式机器学习范式。我们认为可信联邦学习可以解决很多问题,可信联邦学习的特征包括安全可证明,性能可使用,效率可控,决策可解释,模型可监管,普惠等。

腾讯数据合规高级法律顾问李维扬带来了题为《数据流动中的合规风险》的分析,从法律角度,讲解了数据流动当中的关键问题。

首先,数据是一种非常特殊的资产。“数据流动”有多种理解,可以简单理解为数据跨境流动,或狭义理解为各主体间的数据传输共享,但也可以结合数据生命周期来理解。它不同于房子、汽车、手机等资产,无论数据生成的成本如何,其“流动共享”的成本极低,可以跨越时间和空间进行无限地复用,这一特性产生了数据最迷人的地方——“数据外部性”。

“数据外部性”是指,数据的作用完全可能超出其最初收集者的想象、也完全可能超越其最初信息系统设计的目的,即同一组数据可以在不同的维度上产生不同的价值和效用。

如果我们能不断发现、开拓新的数据使用维度,数据的能量和价值就将在流动中层层放大。大数据时代,数据依靠流动共享实现更大的价值,这一理念已经成为共识。

第二,关于数据流动的法律合规体系建设。我们国家总体上要求对数据进行分类分级保护; 重点关注个人数据及重要数据;对不属于个人数据(个人信息)且不属于重要数据的一般性数据流动未进行规制。

此外,对个人数据(个人信息)流动的一般性原则为:合法、正当、必要,明示并征得同意。且个人数据及重要数据出境流动需要按照相应合规路径履行义务。

第三,关于腾讯数据保护的实践。对于数据保护国际上有人提出PbD,即通过产品功能设计,保护用户隐私。基于腾讯的实践,我们也总结出了对于数据保护的方法论,腾讯PBD,P是person,以用户为中心设计产品;B是Button,强调用户有控制力;D是Data,代表数据安全合规。

欢迎持续关注腾讯云区块链主办的链上产业系列活动,在这里,看懂关于链的一切。

0 人点赞