王健宗:联邦智能如何加速AI落地

2020-05-13 16:57:38 浏览数 (1)

报告导读

本文报告介绍了联邦智能及其应用场景,阐述了企业在大数据在隐私保护下如何实现共同进行联邦学习,同时带来了联邦推理、联邦可视化和联邦数据中心等应用场景。

专家介绍

王健宗,平安科技联邦学习技术部总经理,深圳市金融智能机器人研究中心常务副主任,中国人工智能开源软件发展联盟副理事长,平安科技副总工程师,资深人工智能总监,平安联邦学习平台和AutoML平台总设计师,深圳市领军人才,高级工程师。现任中国计算机学会大数据专家委员会委员,高级会员,YOCSEF深圳副主席,曾任美国莱斯大学电子与计算机工程系研究员。发表国际论文30余篇,以及发明专利100多项。主要从事联邦学习和人工智能等领域的研究。

报告内容

在今年的5月28日的时候,国家有颁布数据安全管理的办法,这个办法基本非常详实规定了对用户如何用、如何进行隐私保护。基于这样的办法,很多做爬虫的公司都遇到一些困难,很多大的公司也说“我并没有爬虫部门,没有爬取过任何数据”。这个办法明确规定爬虫应该怎么用、如何用、能不能用,这是非常明确的规定。正是这样一个大的趋势,所以目前对隐私保护,对数据安全的重视,包括对未来人工智能要落地的时候,现在必须要把数据合到一起,但是能不能合,怎么合,这一块国家在政策法规上都有明确规定。

大家知道,很多隐私泄露数据的情况被爆出来,包括315晚会曝出的黑幕,还有美国facebook也有隐私数据的泄露。所以我们最希望的是把数据合到一起,基于基础的best name的模型,结合本地企业、本地个人的数据,延伸更好的模型。包括很多行业的数据,比如电信和金融的用户数据更好地融合,但是这些数据在融合过程中遇到各种各样的困难,我们用的时候也发现,希望自己的数据不能乱用,要基于国家的法律法规,包括外面的数据要合法合规,保证出现前面相关的风险。

人工智能的未来在哪里呢?我正好找到这个,叫联邦智能。大家联邦学习听了很多,就是以联邦学习技术为基础,但是基于破除隐私的孤岛,实现数据共享,包括联邦的推理、联邦可视化、联邦数据中心,包括如何实现大数据在隐私保护下、共享情况下的争议,希望在最后一公里,共同进行联邦学习。

在隐私保护下,怎么样进行多个建模。包括后面的联邦推理是什么,这个也很迫切。做各种AI的公司,首先想到会用一些云的服务,要考虑的是数据共享到云端,这些数据可能是隐私数据,这样可能是不是本地部署。在这种情况下,在使用云端服务的情况下,保证数据隐私的保护,这是联邦推理的技术。包括联邦可视化,现在我们在推联邦学习的过程中,很多客户非常care,到底学习的过程有没有数据泄露,有没有偷我的数据,这一块希望能够更多透明地呈现给大家,实现整个联邦的可视化。包括联邦的激励机制,大家在用联邦学习的过程中,很多公司来讲希望用别人的数据,自己的数据不希望共享给别人。但是,整个过程中大家形成一个共享机制,共同的约束规定,在共同的联邦学习框架下实现争议,这也是一个技术。包括联邦数据中心,这个在大数据时代提供很多,怎么有可行的计算环境,怎么在各个数据和孤岛之间进行建模。这个在学术圈会发现,从去年开始到现在不到一年,相关的课题、工业界的百度词条等等,都呈现爆发式的增长。

联邦学习大家会慢慢比较清楚,怎么样保证安全性、隐私性和数据合法性,实现各个节点之间跨企业、跨节点的共同建模。刚才我说了,联邦学习、联邦推理,实际在云端的能力,我们也希望能够用上。因为云端的能力,可以实时实现模型的跟点,如果本地部署必然有一个滞后期。所以在数据传输的时候,我们希望数据相关给云端模型推理的时候实现过加密,而回传的时候也实现过加密。但是这个可以延伸到很多领域,图像、文本都需要联邦推理,能够用在云端并且能够很好地做好隐私保护,不把客户的隐私数据传到云端。

联邦的可视化,我们自己开发一个小的可视化平台,希望用户利用这个平台的时候,能够很快看到我是跟哪一方联邦学习,同时数据传的是不是有十几数据,整个透明化都能看到,从分析的过程、可视化结合的过程,包括最后分析的结果,都完全可视化。

0 人点赞