人工智能发展目前所面临的严重挑战是什么?众所周知,人工智能离不开大数据,然而现在多数行业中遇到的是小数据,是数据割裂、数据孤岛,成为限制人工智能发展的一大瓶颈。人工智能领域的科学家们如何解决这一难题?
5月24日-25日,中国计算机学会(CCF)年度盛事——2019 CCF青年精英大会(YEF 2019)在成都举办。微众银行AI团队作为联邦学习技术在国内的首倡者受邀参会,微众银行首席人工智能官(CAIO)杨强教授发表特邀报告:《用户隐私,数据孤岛和联邦迁移学习》,为上述人工智能的数据难题提供了答案。
本次大会的主题是“硬科技创新之路”,共包含6个精彩特邀报告、1个大会论坛、2个思辨式YOCSEF论坛、12个专题论坛、以及精彩的思想秀和科技创业秀。来自国内外计算机领域顶尖专家与企业界重磅嘉宾齐聚一堂,800余位青年精英从全国各地慕名而来,探讨深度学习、联邦学习、边缘计算、机器人等计算机前沿领域的未来十年。
图:YEF 2019大会现场
人工智能发展应用越来越广泛,所面临的挑战也日益凸显。人工智能离不开大数据,然而现在多数行业中遇到的是小数据,是数据割裂、数据孤岛,这是限制人工智能发展的一大瓶颈,能否用技术方法解决这个问题?数据隐私保护日益严格,传统打通数据的方式受限,如何建立起安全有效的数据协作机制? 针对以上问题,微众银行首席人工智能官(CAIO)杨强教授在特邀报告《用户隐私,数据孤岛和联邦迁移学习》中指出:“迁移学习”是将大数据迁移到小数据,实现举一反三,而“联邦学习”则可以让多个参与方数据不出本地进行合作,“联邦迁移学习”将“迁移学习”和“联邦学习”结合起来,系统介绍了联邦迁移学习如何帮助不同机构打破隔阂,联合建立AI模型,同时各方数据不出本地,用户隐私得到最好保护。
图:微众银行首席人工智能官杨强教授特邀报告
杨强教授通过详实生动的案例展示了联邦迁移学习现阶段已经落地的行业应用,包括金融领域各机构联合建立企业风控模型、银行间联合建立反洗钱模型、城市管理中的视觉应用等,指出联邦迁移学习可以让机构在不共享数据的情况下合作提升机器学习效果,对模型提升率高达15%并且可以实现模型效果无损失,具有广阔的行业应用空间,随着联邦生态的不断完善和国际标准制定的不断推进,一定可以发挥更大的行业价值。
大会特设的“联邦学习及用户隐私”专题论坛,围绕“联邦学习”和“数据安全”、“用户隐私”展开讨论,吸引了大批专家、学者和青年精英参与。会上提到,“联邦学习(Federated Learning)”是一种加密的分布式机器学习技术,让参与各方在自有数据不出本地,保护数据隐私的前提下进行联合建模,提升机器学习的效果,为数据隐私保护提供了新思路。目前在这项技术的研究上,我国居于世界前列。谷歌提出了基于手机终端的联邦学习算法框架,微众银行则首次提出针对多方机构合作的“联邦迁移学习”,并且通过开放开源平台Federated AI Technology Enabler(FATE)发布了通用的联邦学习解决方案,推动联邦学习技术在行业中的落地应用。
微众银行与来自鹏城实验室、平安科技、创新工场、北京航空航天大学、瑞士再保险等知名高校及企业的重磅嘉宾就联邦学习的核心技术、行业应用进行了深入讲解与探讨。
图:微众银行AI部门高级研究员刘洋专题演讲
在以“学界、产业界代表漫谈联邦学习在数据隐私保护上的突破与未来”为主题的圆桌环节,专家们围绕联邦学习的落地应用场景、现阶段面临的挑战和未来发展方向等问题进行了讨论,特别是分析了企业在进行联邦学习合作过程中可能会遇到的问题,并给出了相应的解决方案,为未来更大范围的行业合作奠定了基础。
图:微众银行参与联邦学习圆桌论坛
为期两天的大会是学术论辩,是思想碰撞,更是对科技未来的大胆探索。联邦学习作为新兴的人工智能技术,下一个十年将走向何方?微众银行和业界各位专家们给出了答案——行业落地。