近日,德勤发布的《未来医院报告》指出:未来的医疗机构长期发展需要建立数字化转型的文化内核;具备信息分享及便捷沟通的科技技术;注重医疗数据收集及分析;引入更适应医疗数字化的人才及更重视信息安全等。数据、安全、科技都是报告中反复提及的关键词。
2016年6月,国务院办公厅发布的《关于促进和规范健康医疗大数据应用发展的指导意见》明确指出:“到2020年,健康医疗大数据相关政策法规、安全防护、应用标准体系不断完善,适应国情的健康医疗大数据应用发展模式基本建立。”而后,我国又陆续出台了《数据安全法》、《个人信息保护法》等数据保护相关法律法规。
2021年7月1日,我国正式实施《信息安全技术健康医疗数据安全指南》,详细规定了医疗数据分类、使用披露原则、安全措施、安全管理指南、安全技术指南等,并对八个代表性医疗数据应用场景的数据安全进行了分析,罗列了数据应用中最常出现问题的临床研究数据、健康数据、移动应用数据及医疗器械数据等,解决了健康医疗数据的融合共享和开放应用,让数据在为个人及国家利益服务的同时,也保证了个人信息的安全和国家公共利益的需要。
多份相关文件反复强调医疗大数据的重要性和使用价值,可见我国对于医疗领域数据应用的需求已经迫在眉睫。医疗大数据具有特殊的价值和意义,不仅因为医疗大数据具有更加严格的隐私保护性要求,更因为其具有更高的生命价值影响力。在数据要素流通的大背景下,如何兼顾医疗数据隐私保护和数据价值挖掘就成了重要突破口。隐私计算的出现,恰好在技术上为医疗数据隐私保护和数据价值流通提供了一条可靠、有效的可实施路径。
隐私 计算,是数据密态时代的两个重要命题
通俗地讲隐私计算的技术原理就是将明文数据转换为密文数据,在原始数据不出域的情况下,使以密文数据计算得出的结果与明文数据计算得出的结果相同,从而实现数据价值流通。更重要的是,以隐私计算为基础流通的是数据的价值而非数据本身,这既满足了数据的安全性,又实现了流通的实质。基于这些优势,隐私计算目前已被广泛应用于金融、医疗、政务等众多领域,并取得了一定的成效。
在隐私计算行业内,隐私和计算是两个绕不开的重要问题。如何充分保护数据隐私,以及如何保证密态数据的算力效率及准确性,一直以来都是隐私计算厂商需要直面和突破的难点。
锘崴科技创始人、董事长王爽介绍道:“在数据隐私保护方面,锘崴科技目前已有众多解决方案,能够在业务流程的各个环节实现对数据的全方位安全守护”。具体可以从几个维度来对锘崴科技隐私计算平台的安全策略进行拆解。
首先,在训练过程中通过大量的训练和测试样本,反复验证不同指标以及不同测试集下联邦学习的性能,从而保证模型的泛化性。其次,根据通过对抗样本进行反复验证以防止数据被投毒。第三,在数据源布置可信执行环境的节点,实现远程的程序和数据验证。最后,平台可结合区块链技术,对所有计算过程及数据的哈希信息进行存证,一旦发现计算结果有异议,可以通过区块链进行溯源,重现计算,从而实现结果防御,增加造假成本。有了全流程的安全策略做保障,再加上区块链技术保驾护航,锘崴科技隐私计算平台筑牢了安全护城河。目前这些方法已经充分应用到医疗领域的落地实践中,并取得了现实意义。
有了安全保障,如何提升算力?王爽给出了进一步的解答:数据密态时代下,需要不断打破效能与准确性的平衡点,高融合,快耦合,提高快速适配能力。王爽分享道:“目前,锘崴科技提供了一套联邦式的方法,可以快速适配大多数企业对于隐私计算的需求,并能够进行最大化复用,每次只需简单更改算子层面的适配,即可快速部署使用。同时在全链路充分保障数据安全,大大降低定制化需求,提升了联邦学习的效率。”
另外,锘崴科技还为用户提供了一套模型层面的编译器,通过选配的方式最大限度地降低使用联邦学习的门槛,大大提升了用户使用频率,并有效降低使用投入。在不断探索效能与安全的平衡点的过程中,锘崴科技正在逐步让隐私计算更高效、更安全、更易操作。
锘崴科技产品优势
深耕医疗行业,让隐私计算发挥更大的生命价值
对于隐私计算厂商来说,金融和医疗两个领域是两块大蛋糕。而锘崴科技更专注于医疗领域的深耕,除了锘崴科技的创始团队跟医疗有着不解之缘以外,还源于锘崴科技对于医疗行业的热忱与对行业未来发展的信心。
王爽对医疗行业有着强烈的信念和信心。他认为:首先,医疗行业的天花板足够高,市场规模足够大。据OECD Health Statistics 2021统计报告显示,OECD38国平均医疗支出占GDP的比重为8.8%左右,各国医疗支出占GDP的比重分别为:美国16.9%,日本10.9%,韩国8.1%,中国为5%(OECD全称:经济合作与发展组织,简称经合组织,是由38个市场经济国家组成的政府间国际经济组织)。从数据看出,我国在医疗领域的支出远低于欧美国家的平均水平。但是近年来我国医疗支出在GDP中的占比也在持续提升。据公开数据显示,2003年这一数字为4.8%,2019年已经达到了6.6%。未来中国医疗领域的发展还有更多的空间和想象。
其次,医疗领域的数据隐私保护至关重要。2018年9月13日,国家卫健委印发《国家健康医疗大数据标准、安全和服务管理办法(试行)的通知》,对健康医疗大数据从标准管理、安全管理、服务管理、监督管理等方面加以规范。
不仅国内对医疗数据的重视程度在提升,放眼全球,医疗数据的隐私保护也广受关注。2021年6月,英国国家医疗服务体系(NHS)曾发布《数据拯救生命:以数据重塑健康及社会关怀》战略草案,草案的核心在于突出数据隐私及安全的重要性,希望病人更容易访问及控制自身健康和护理数据,让数据助力发现新治疗方法。
另外,隐私计算在医疗行业的落地应用具有双重壁垒,无形中也更加突出锘崴科技在隐私计算行业内的竞争力。目前,锘崴科技通过技术的优化迭代,打造核心技术壁垒,创造先发优势,并且正在更快速的布局、适配更多不同的行业领域。
然而,有别于金融等领域的隐私计算应用,隐私计算在医疗行业的应用要求则更高。王爽分享道:“在医疗场景下,我们所提供的联邦学习解决方案既要满足精度上的要求,又要满足数据结构化的要求。首先,从模型层面来讲,我们设计的联邦学习解决方案的隐私计算模型,要充分保证数值精度上的一致性,使其在发生医疗纠纷时,能够清晰划分责任边界。其次,整个医疗行业的数据类型相比其他行业更加丰富,它包括但不限于结构化的临床数据、非结构化的临床医嘱数据、基因检测信息数据、医学影像数据等等。基于不同的数据源,需要使用不同的分析方法。因此在医疗场景下,对于隐私计算的要求和挑战更大,但同时隐私计算也具有更高的价值和更大的意义。”
锘崴信®安全联邦学习系统
不拘泥于当下,隐私计算应该被赋予更多想象空间
2022年2月8日,国家卫健委公布的《对十三届全国人大四次会议第10294号提议的答复》文中称,卫健委正在研究建立全国统一的电子健康档案、电子病历等信息标准体系。可见,医疗领域的信息化建设正在加快实施步伐。
同时,隐私计算在医疗领域的应用场景也在不断拓宽。比如,欧盟通过“机器学习分类账编排药物发现”项目构建了Owkin Connect平台,该平台通过分布式架构和联邦学习创建脱敏数据模型,实现药物研发。澳大利亚的 Presagen 公司,通过连接全球的医疗数据,利用联邦算法提高评估胚胎活力的准确度。在国内,锘崴科技也在医疗领域不断尝试更多隐私计算的应用场景。
王爽介绍道:“锘崴科技落地的医疗场景有很多,具有代表意义的场景如新药研制、罕见病研究等。以新药研制为例,锘崴科技的隐私计算技术可以深入到临床前、临床中、临床后的各个环节,并发挥重要作用。”
在临床前,隐私计算技术可以对药物的化合物、蛋白质、序列等做跨药厂、跨工艺之间的数据共享和分析;在临床中,从数据收集、数据分析到数据应用等各个环节都需要应用隐私计算来对数据进行安全保护、防篡改、跨域数据的研究。在药品上市之后,还需要以大量的医院真实数据为基础,应用隐私计算对真实世界的证据进行研究,包括药物的副作用研究、药物适应症的扩展研究等等。
锘崴科技医疗应用场景
相比其他领域,医疗行业的数据价值也更具现实意义。医疗数据的合规采集及应用将有助于推进医疗数据资源的开放共享,让数据释放更大的价值;医疗健康数据的聚集整合,将有助于加快推进电子健康档案、电子病例等医疗数据资源的整合;医疗大数据的跨域整合应用、数据的挖掘分析,将有助于提高医生诊断的精度和效率,实现早诊断、早治疗,提升生命价值;医疗大数据的科研应用,还将广泛应用于新药研发、罕见病研究、药物副作用研究以及医疗保险场景等等。而所有这些,都离不开隐私计算。
隐私计算技术的进一步成熟完善以及与医疗场景的深入融合,对于人类社会的生存研究以及生命价值探索具有深层次的价值和意义。相信未来,以锘崴科技为代表的隐私计算厂商必将在医疗领域发挥更大的价值和能量,将更多“不可能”变成“可能”。
文:晴天 / 数据猿