本体技术视点 | OpenKG区块链:构建可信开放的联邦知识图谱平台(下)

2021-07-12 15:28:57 浏览数 (1)

本文转载自: 数据智能英文刊 由本体首席技术专家 Ning Hu 等团队成员参与撰写。OpenKG 是目前国内最有影响力的开放知识图谱平台之一,汇聚了众多国内优秀的开放图谱数据资源。

上一期主要包含文章的摘要、知识图谱与区块链两个章节,本期我们将带来论文的下半部分:技术贡献应用服务


本文技术贡献

(1)知识的价值度量

OpenKG 设计了 K-Point(Knowledge Point)合约以体现知识价值。OpenKG 对于知识价值的评估基于简单模型,如:每次知识被使用即为知识追加 Knowledge Point。随着知识使用场景的增多,OpenKG 会持续使用一些可学习的算法,针对不同领域的知识点价值评估模型进行校准和优化调整。OpenKG 同时设计了 OpenKG-Token 合约,从知识贡献价值衡量的角度,颁发给知识点贡献者(发布者、审阅者、修改者),作为凭证。OpenKG-Token 根据知识使用时的知识价值度量,按照知识贡献进行分配,代表知识贡献者的权益

图3 上链基本技术架构

(2)OpenKG 上链基本技术架构

在可信基础设施层面,OpenKG 区块链采用 VBFT 共识算法,在传统 BFT 算法的基础上,引入“VRF(可验证随机函数)”,提高了共识算法的抗攻击能力的同时,提升了共识速度;本体网络采用 Wasm-JIT 技术作为智能合约执行环境,目前执行效率在业界是最高的;本体网络提供了分片和 Layer2的技术,为兼顾链上业务性能和区块链网络扩容方案。在联邦知识图谱和业务应用层面,以分布式(去中介化)身份标识协议(ONT ID)识别知识点、知识关系、知识贡献者和知识使用者,以分布式资源交互框架(DDXF)管理和追踪知识发展和实用全过程,以跨系统互操作协议支持知识在不同系统中的业务服务

其中关于账户与数据标识,OpenKG 区块链使用非对称密码学算法作为区块链账本数据和所有者之间物权关系的证明。OpenKG 支持用户私钥的代理托管服务,保证用户的互联网用户体验。对于个人隐私有诉求的用户,也可以方便的使用自己的公私钥对取回个人的知识贡献并确权。ONT ID 将被用作 OpenKG 知识生成、使用场景的各类系统和区块链节点中的分布式身份标识。基于 ONT ID 可以为标识指代实体签发可验证凭证,可验证凭证支持多维认证,可以接入不同的身份信任源。分布式身份标识、多维度的可验证凭证,为知识的不同使用场景提供了可信的账户体系和风控模型。

通过 OpenKG 的分布式数字身份体系,支持用户个人数据贡献的链上资质认定、确权和实际使用的逻辑。任意知识使用场景可以自主开发应用平台,通过分布式身份标识的可验证凭证对用户资质进行校验,方便知识贡献并为知识使用者提供知识服务。OpenKG 将知识数据的权限令牌和链上标识的数据 data-token 结合起来,在使用区块链防篡改、可追溯、去中介确权等特性的基础上,仍然支持中心化的知识服务提供,满足知识使用场景的高效率需求。

(3)OpenKG 中的知识确权

OpenKG 的联邦式知识图谱构造和使用过程中,涉及知识所有、整理、加工、查看、使用等多种权限。结合开放性知识图谱中不同知识数据的粒度,如数据集、实例、Triple 三元组等,需要支持对应不同粒度知识的确权。OpenKG 区块链使用分布式身份和 token 方案为多个知识系统提供跨系统协同的账户、数据和权限管理。首先,OpenKG 数据持有 ONT ID,不同系统中数据的标识唯一,因此支持跨系统知识的标识识别。进一步的,针对不同的知识使用场景,知识所有者、贡献者可以主动创建知识权限令牌,并且整个授权过程上链,因此令牌使用过程中,确权安全可信。同时,OpenKG 用户持有 ONT ID,可以在不同系统不同知识使用场景中识别同一用户,并且可以跨系统追溯到知识贡献者,保证使用过程的溯源。

(4)OpenKG 中的知识溯源

OpenKG 通过知识贡献者的 ONT ID 管理知识 ONT ID,支持 OpenKG 的知识应用场景中方便创建使用令牌,进一步支持跨系统的使用确权。新知识绑定新的 ONT ID,根据现有知识推导出的新知识的过程以区块链交易的形式在链上记录下来,并通过区块链智能合约交易的形式自动构造 ONT ID。所有知识的创建和加工过程都以链上交易的形式保留在链上,知识的标识在 OpenKG 的多个系统中保证唯一,因此支持知识溯源

(5)OpenKG 的可信度量

基础设施层面:OpenKG 区块链的网络规模和节点分布程度为基础可信提供背书;

知识质量层面:知识质量通过知识价值体现,知识价值通过知识的使用体现。OpenKG 根据知识领域和知识使用行为分析获得知识价值量化的方案,并在量化反馈的过程中持续迭代修正。知识使用的过程在链上有记录,防篡改、可追溯,可为数据的真实性和一致性提供信任背书;

知识贡献者和使用者层面:由于所有的行为都在链上记录并可追溯,贡献者或使用者行为的分析和知识质量的结果可作为贡献者或使用者的可信背书。值得一提的是,区块链并不能甄别作恶数据,但是系统外能够提供作恶行为的证明并且永久有效,反过来影响贡献者或使用者的贡献度

应用服务

OpenKG 旗下包括多个子项目和资源网站,如开放资源共享平台 OpenKG.CN: http://openkg.cn、中文开放知识图谱 cnSchema:http://cnschema.org、中文开放知识图谱众包平台 OpenBase:http://openbase.openkg.cn。目前 OpenKG 完成了基础区块链平台的搭建与测试工作,以及 OpenKG.CN 数据集、工具集和 OpenBase 细粒度知识的上链测试。目前,通过 OpenKG 发布的开放图谱和开源工具,以及通过 OpenBase 众包采集的三元组,OpenKG 都在链上进行存证记录操作,并计算和分配产生的荣誉值。考虑到性能的约束及必要性,目前实现对知识图谱的操作(上传、审核、编辑、搜索、下载、查询等)的上链。在测试平台中,上链测试实现了实体/三元组粒度的知识确权。OpenKG 区块链网络初始节点目前暂定为七个,交付给不同的大学或企业机构来运营,这个七个节点相互独立,构成多中心的 OpenKG 区块链基础架构,通过共识机制同步 OpenKG 分布式账本,共同提供分布式的可信基础设施。未来根据需要逐步扩增更多的核心节点。


0 人点赞