WWW2022 最佳论文直播解读 | 大规模自动化图学习！

来自北京大学DAIR实验室与腾讯TEG机器学习平台部Angel Graph团队共同完成的研究斩获WWW 2022唯一最佳学生论文奖（Best Student Paper Award）。

直播预约

直播主题：可扩展的图神经结构搜索系统 | WWW2022

直播时间：6月1日 14：30-16：00

讲师介绍：

张文涛

腾讯TEG机器学习平台部 Angel Graph团队应用研究员

北京大学计算机学院2020级博士生，TEG机器学习平台部Angel Graph团队成员。以第一作者在机器学习（ICML，NeurIPS，ICLR）、数据挖掘（KDD，WWW）和数据库（SIGMOD，VLDB，ICDE）等领域发表顶会论文10余篇，包含WWW’22最佳学生论文和NeurIPS’21 Spotlight论文。参与开源了多个机器学习系统，如大规模图学习系统SGL、分布式机器学习系统Angel、自动化机器学习系统MindWare和黑盒优化系统OpenBox。曾获2021年度Apple Scholar。

（一）直播简介

本论文研究了大规模图学习过程中面临的图模型可扩展性低以及建模门槛高两个问题，进而提出了一套能自动化建模超大规模图网络的可扩展图学习系统。本文还实现并开源了一套多目标自动化图神经结构搜索系统，来支持更简单和更高效的大规模图学习。系统相关工作已广泛应用于金融风控和社交网络推荐等业务，并获得了WWW会议30多年历史上中国第二个最佳学生论文奖。

（二）直播摘要

图神经网络模型在多个图任务上都取得了最佳效果，并受到了学术界和工业界的广泛关注。然而，现有的图神经网络系统有两个瓶颈。一方面，受限于单机场景下的存储和计算开销以及分布式场景下的通信开销，大多数基于消息传播机制的图神经网络模型可扩展性较低，很难直接用于工业界大规模图数据。此外，现有的图神经网络系统需要用户针对特定图数据和图任务编写代码和训练流程，然而设计网络结构也需要经验丰富的专家，建模成本很高。

本次直播将首先介绍大规模图学习面临的可扩展性以及建模瓶颈，接着会详细阐述系统的目标以及系统设计和方法。最后，介绍系统的实验效果并进行总结。总的来说，本次直播主要回答了以下几个问题：

将图神经网络运用到工业界大规模图数据上面临着哪些挑战？
如何自动化设计预测性能好且资源占用少的图神经网络模型？
相较于已有的图神经网络系统，我们有什么新的特色或优势？

（三）预约方式

识别下方二维码

或点击视频号直播预约

扫码进群可与专家实时互动，

参与抽奖，领取视频大礼包~

2022年4月29日晚，在线上举办的2022年国际万维网大会（The Web Conference，简称WWW）上，腾讯TEG机器学习平台部Angel Graph团队联合北京大学DAIR实验室的最新成果“可扩展范式下的图网络架构搜索系统 (PaSca: aGraph Neural Architecture Search System under the Scalable Paradigm)”获得大会唯一最佳学生论文奖（BestStudent Paper Award），北京大学-腾讯协同创新实验室主任崔斌教授也受邀在大会闭幕式上发表获奖感言。

图1 获奖证书以及官方宣传

WWW（现改名为TheWebConf）会议是计算机和互联网领域历史最为悠久同时最为权威的顶级学术会议之一，被中国计算机学会列为A类推荐国际学术会议。本次会议共收到1822篇论文投稿，最终录用323篇，录用率为17.7%。本次会议仅评选出一篇最佳论文奖和一篇最佳学生论文奖，获奖论文首先被会议“系统和基础设施”方向推荐为最佳论文进入到大会最佳论文候选（共11篇），并在最终评比中获最佳学生论文奖，这是WWW成立30多年以来，中国学术研究机构第2次获得最佳学生论文奖。

WWW官方Award链接：

https://www2022.thewebconf.org/awards/

论文链接：

https://dl.acm.org/doi/10.1145/3485447.3511986

系统链接：https://github.com/PKU-DAIR/SGL

一、内容简介

图神经网络模型在多个图任务上都取得了最佳效果，并受到了学术界和工业界的广泛关注。然而，现有的图神经网络系统有如下图所示的两个瓶颈。一方面，受限于单机场景下的存储和计算开销以及分布式场景下的通信开销，大多数基于消息传播机制(Neural Message Passing，NMP)的图神经网络模型可扩展性较低，很难直接用于现实生活中的大规模图数据。如图2所示，以典型的基于消息传播机制的GraphSAGE模型为例，分布式场景下的高昂通讯代价限制了图神经网络的可扩展性。此外，如图3所示，现有的图神经网络系统需要用户针对特定图数据和图任务编写代码和训练流程，然而设计网络结构也需要经验丰富的专家，建模成本很高。

图2 图神经网络的可扩展性瓶颈

图3 图神经网络的建模瓶颈

本论文研究了大规模图学习过程中面临的图模型可扩展性低以及建模门槛高两个问题，进而提出了一套能自动化建模超大规模图网络的可扩展图学习系统。具体来说，本文提出了一个新颖的图神经网络建模范式，并基于该范式设计了一个超过15万种网络结构的可扩展图网络设计空间，为图神经网络可扩展性的相关研究指明了一个新的方向和路线。此外，本文还实现并开源了一套多目标（如模型预测效果和资源占用）自动化图神经结构搜索系统，来支持更简单和更高效的大规模图学习。

二、系统目标

区别于现有的大规模图神经网络系统，本文提出的PaSca是一个端到端的系统。如图4所示，系统的输入有两部分组成：1）图数据 2）搜索目标（预测性能、内存占用、训练以及预测效率等）。给定这两个输入，系统能自动化地在预定义的可扩展图网络搜索空间进行高效地搜索，并输出能兼容多个搜索目标的可扩展图神经网络模型。

图4 系统目标概览

三、系统设计与方法

（一）可扩展性图神经网络建模范式

图5 两种建模范式的对比

如图5所示，现有的图神经网络模型大都遵循如上图所示的消息传递机制。此外，为了兼容主流的图神经网络模型，相应的图神经网络系统也使用基于消息传递机制的系统抽象。然而，基于消息传播机制的图模型在每个batch训练过程中都需要进行聚合和更新操作。当图节点数据分布在不同机器上时，频繁的聚合操作会导致高昂的通信开销。区别于现有的消息传递机制，本文提出的Scalable Paradigm(SGAP)将消息聚合操作和更新操作分离，定义了可扩展性图神经网络建模的新范式：前处理—训练—后处理，消息聚合操作只存在于前处理和后处理中，极大地降低了分布式场景下的通信开销。

（二）自动化搜索系统

本文提出的自动化搜索系统包含两个模板，分别是搜索引擎以及分布式验证引擎。如图6所示，在每一次迭代中，搜索引擎都会从搜索空间中推荐相应的可扩展图神经网络结构，之后评估引擎训练图网络模型并返回模型的验证结果。

图6 PaSca自动化搜索系统架构图

搜索引擎的主要目标是找到在SGAP建模范式下能同时兼容多个搜索目标的可扩展图神经网络结构。如表1所示，它首先定义了一个包含15万种不同网络结构的搜索空间，并基于贝叶斯优化来实现网络结构的推荐。在每次迭代中，推荐服务器会建模观测到的网络结构与优化目标值之间的关系，并推荐能最好地平衡多个优化目标的网络结构。最后，它基于验证引擎返回的观测结果来更新历史信息。

表1 基于SGAP的网络结构搜索空间

验证引擎的主要是用来高效评估被推荐的模型性能。对于前处理和后处理阶段，图数据聚合器会将图数据划分并存储到多台机器上。对于任意节点，当它的第i-阶消息计算完成之后，工作节点会拉取它的邻居信息并计算它下一阶的信息。在训练阶段，每个工作节点都可以用批训练的方式基于参数服务器来实现网络参数的更新。

四、实验效果

本文在十个真实的数据集上进行实验，实验主要是为了说明：

基于SGAP的图神经网络建模范式具有高可扩展性；
PaSca系统搜索出来的网络能很好地平衡多个搜索目标，并取得良好的预测性能。

图7 可扩展性分析

本文比较了基于SGAP范式建模的PaSca-APPNP模型以及基于NMP范式建模的GraphSAGE模型在分布式场景下的可扩展性。固定总的批处理大小并增加工作节点的数目，如图7所示，实验发现PaSca-APPNP能够获得更接近理想情况下的加速比。

图8 搜索结果的帕累托平面

如图8所示，实验展示了PaSca系统在Cora数据集的搜索结果的帕累托平面。本文从中挑选了3个代表性的模型，分别命名为PaSca-V1, PaSca-V2和PaSca-V3。这些代表性模型能兼容不同的优化目标，比如PaSca-V3取得了最小的分类误差但是比PaSca-V2的预测时间更久。

图9 搜索结果的训练时间与预测性能对比

如图9所示，本文实验测试了搜索出来的代表性模型在实际Industry数据集上的预测性能和训练时间。可以看到PaSca-V2和PaSca-V3的预测效果都优于JK-Net，但是训练时间更短。此外，如表2所示，本文在八个数据集上测试搜索出来的代表性模型的预测性能。实验发现，基于SGAP建模范式的图神经网络模型能够取得和其他范式下模型相当甚至更好的预测性能。另外，搜索出来的PaSca-V3始终取得了最好的模型预测性能。

表2 搜索结果的预测性能

五、系统应用

Angel Graph图计算团队目前负责论文成果在腾讯内部的技术落地。获奖论文的相关成果已实现于Angel Graph系统并部署于腾讯公司太极机器学习平台，广泛应用于金融风控和社交网络推荐等业务，代表性业务落地场景如下：

文章视频推荐场景点击率提升1.6%；
平台内容风控场景恶意识别覆盖率提升10%；
运营平台中心社交反欺诈场景欺诈账号识别覆盖率提升20%；
个人主页用户相似推荐场景人均关注提升2.397%。

六、总结

图神经网络模型在多个图任务上都取得了最佳效果，并受到了学术界和工业界的广泛关注。然而，大多数图神经网络模型可扩展性较低，很难直接用于现实生活中的大规模图数据。此外，设计针对特定图数据和图任务的神经网络结构也需要经验丰富的专家，建模成本很高。为此，本文提出了一个非常新颖的图神经网络建模范式，并基于该范式设计了一个可扩展的图神经结构搜索空间，为图神经网络可扩展性的相关研究指明了一个新的方向和路线。

此外，本文还实现并开源了一套多目标（如模型预测效果和资源占用）自动化图神经结构搜索系统，搜索出来的代表性模型在预测性能、效率以及可扩展性方面都取得了较好的平衡。PaSca系统能帮助研究者更好地探索可扩展的图神经网络结构，极大地促进了图神经网络从学术研究走向实际落地。

搜索引擎机器学习深度学习人工智能数据结构

0 人点赞