此前,我们发布了本体首席技术专家 Ning Hu 在由 ECUG 社区主办的 2021 ECUG Con 全球技术大会上做出的分享第一期和第二期:本体技术视点 | 数据的去中心化协作和可信流动(一)& 本体技术视点 | 数据的中心化协作和可信流动(二)。介绍了“去中心化”、“去中介化”、”多中心化“的几种形态,以及在各类形态下的工作模式。
图 | 网络
本期我们继续围绕这一话题,与具体的数据业务相结合进行探讨。
04
关于数据业务/Data Business
数据业务亟待解决的问题主要包括4个方面:
- 数据拥有方对数据本身隐私性的安全需求
有的数据可以以副本的形式提供给数据协作的对手方,有的数据对其他第三方不可见。
- 终端用户准入门槛高
已有的数据服务偏重于企业级用户,缺乏基于个人用户数据的个人服务,因此在个人数据确权的环节有缺失。
- 数据在流动过程中不可被篡改
没有被非授权的第三方获取,以一种可信的方式从一方流动到另一方。
- 作恶与数据服务高效性
一个数据服务体系需要配套相应的清结算服务,以激励数据提供方提供高质量的数据,数据处理算法提供方提供高质量的数据处理算法。
在这样的背景下,我们引入 SAGA 网络,可以将其视为“数据流通的连接器”,在保证数据角色确权的情况下,提供完整的数据生命周期管理,实现链上链下融合、可信安全、高效集成。当我们描述数据处理的时候,其实关注有不同参与方,包括算法提供方,数据提供方,包括数据的加工场所,SAGA 致力于成为可以集成协议和操作灵活的一站式平台。
目前来说,有很多包括联邦学习、MPC、多方计算等技术手段来保护数据隐私。在某些情况下,数据的提供方不愿意把数据暴露给加工方或者是数据购买方。但是实际的数据应用中间会出现一些情况。举个例子:我需要百万级体量的数据,但是只找到3家采购方,他们只能测试40万亿条数据,这时候就需要一个场所,提供120万亿条数据一起进行计算。
但是数据供应方之间有需求,他们不希望数据互相可见,这里需要具备给竞争对手提供数据的能力。这时可以有很多计算方式作为选择,包括可信执行环境(TEE)这种第三方提供的一些平台保证,还有联邦计算。在数据结构和数据算法没有那么复杂的时候,会考虑用一些算法做支持,但不管怎样,核心都是要保证三方的安全性。
这个时候,我们需要沿用之前区块链的逻辑,考虑什么样的架构能够予以支持。基本上我们会考虑通过跨系统协作,为数据互操作提供确权的证明,这是通过区块链来实现。大数据是一笔生意,所以需要有相对资产化的方案。
这其中一个核心的要点是分布式的多元数据加工网络,这个多元数据加工网络一定程度上也可以借鉴多中心的逻辑。与此同时,仍然需要有一些开放式的数据计算框架。这当中的核心是一个服务网络,该服务网络后台关注的点由区块链来完成的是权限管理这一块。对于区块链,特别是多中心网络来说,我们希望达到的目标是比较少的“写”,但是比较多的“读”,和分布式网络一样。但事实上我们描述区块链网络的时候,我们希望做到快速的“读写”,这里面是相互矛盾的。如果做权限管理这一块的话,通过区块链进行控制,可以大大降低在业务时候的写的状态,所以在一定程度上缓解了这部分的矛盾。
同样,在数据的分布式计算网络里面,可以有不同的区块链,不同的中心化系统,已有的互联网系统都可以引入进来。如果有需要他们可以用子化的方案,直接跟现有的客户端进行沟通。
图 | 网络
接下来分享一下目前我们使用的一些场景。公链是一个全球分布运营的实体,所以这在地域合规层面会具备一定的困难。
在公链上面信任背书的方式通过治理来实现,这个治理一般与费用相关。这是为什么公链上面经常会提到很多 token、公正、资产的原因,因为这是节点治理,如果这个节点出了问题,我们可以通过罚没一部分的保证金,他会考虑作恶成本,作恶成本和有价值的 token 挂钩,这就是为什么在公链上我们能看到 token 的原因。但是联盟链没有这个问题,因为联盟链一般是通过合同促成,所以是法律背书的逻辑,它的信任背书通过法律得到保证。
一般的情况下,我们会考虑在联盟链之间仍然有需求的话,可以借助第三方,一般来说可以是公链,来提供基础设施的支持,可以通过联盟链来支持令牌化、资产化,来保证上层正常的业务运营。
同时,对人、财、物、事,包括智能设备,包括合作方都是通过前面提到的 DID,去中介化的身份进行管理。
互动时间
以下哪个选项说法正确?
A. 在公链上面信任背书的方式通过治理来实现,这个治理一般与费用无关
B. 联盟链可以借助公链提供基础设施的支持
C. 已有的数据服务偏重于个人用户,在企业级数据确权的环节有缺失
D. 公链是一个全球分布运营的实体,所以这在地域合规层面会不具备困难
请将正确答案私信后台,前5名答对的小伙伴将每人获得【本体T恤】一件哦~