作者:Shoujin Wang
Shoujin Wang, 麦考瑞大学博士后,
研究方向:数据挖掘,机器学习,推荐系统。
编者按
作为人工智能最重要的应用之一,推荐系统几乎存在于我们日常生活的各个角落。作为人工智能最具有前景的技术之一,图学习在学习推荐系统中的各类客体间复杂关系上表现出了强大的优势。希望通过这篇文章,可以让你对基于图学习的推荐系统形成一个全面而系统的认知。
01 论文简介
本文给大家介绍一篇被今年国际人工智能联合会议IJCAI 2021接收的从图机器学习的视角对推荐系统领域最新进展进行梳理和总结的综述文章。文章题为Graph Learning based Recommender Systems: A Revie。这篇文章是基于图机器学习的推荐系统方向的第一篇较为系统全面的综述文章。该文短小精悍,没有太多的公式和推导,更多的是作者对问题和挑战的思考,对方法的归类和总结,易于阅读和理解,尤其适合想要进入该领域的初学者。读者可以通过该文快速了解主流和前沿的基于图学习的推荐系统算法。值得注意的是,作者名单中出现了好几个该领域内的国际知名专家,如Francesco Ricci,Philip S. Yu,Xiangnan He等。
02 论文主要内容
文章深入浅出,从为什么需要建立基于图学习的推荐系统着手,从较高的层次将基于图学习的推荐系统进行了较为泛化的形式化定义;然后从数据驱动的角度出发,系统地介绍了推荐系统中涉及到的各种各样的图数据以及他们的主要特征,并阐述了这些特征分别给推荐系统带来的各种挑战;紧接着,文章系统地从技术和模型的角度对当前的基于图学习的推荐系统方法进行了分类,并介绍了每一类方法的基本思想和原理以及所解决的挑战;为了方便读者的研究工作,文章整理了一些最有代表性的开源算法和一些最常用的公开数据集,并提供了代码链接供读者参考;最后文章展望了该领域的四大未来前沿研究方向。
推荐阅读原文,论文预印版链接:
https://www.researchgate.net/publication/350979695_Graph_Learning_based_Recommender_Systems_A_Review
03 论文的简短翻译
0
摘要
近些年以来,一个新兴领域—基于图学习的推荐系统(Graph Learning based
Recommender Systems (GLRS))正快速发展。图学习的推荐系统主要借助于先进的图学习技术和方法来为推荐系统更好地学习用户偏好和物品特征。不同于其他的推荐系统,图学习推荐系统建立在图之上。在图上,包括用户,物品等各种客体都是显式或隐式地相互连接的 (见下列图Figure 1)。随着图学习技术的发展,探索和利用图上各种同构或者异构的关系是建立更有效的推荐系统的一个颇具前景的方向。在本文中,我们对基于图学习的推荐系统进行了一个系统的回顾。我们讨论了他们怎样从图中抽取知识来提高推荐结果的准确度,可靠性和可解释性。具体而言,我们首先刻画和形式化定义了基于图学习的推荐系统,然后归纳和分类了这个领域中的主要挑战和进展,紧接着总结和整理了一些典型的开源算法和常用的公开数据集,最后分享了一些前沿的未来研究方向。
01
引言
1.1 动机:推荐系统为什么需要图学习?
(1)推荐系统中的大多数数据本质上就存在着自然的图结构。
(2)图学习具有从图数据中捕获和学习各种复杂关系的天然优势。
1.2 形式化定义(见原文)
1.3 本文贡献
(1)我们系统地分析了推荐系统中各种不同图数据的主要特征以及他们给推荐任务带来的关键挑战,并从数据驱动的角度对此进行了分类。这给更好的理解图学习推荐系统的重要挑战提供了一个全新的视角。
(2)我们系统地回顾了基于图学习推荐系统这一领域内最先进的工作,并从技术的角度对他们进行了系统的分类。基于此,我们总结了基于图学习推荐系统的主要进展。
(3)我们整理并分享了基于图学习推荐系统的一些最具代表性和最先进的开源算法,以及该领域内最常用的一些公开数据集,并分别提供了链接以供读者参考。
(4)我们分享了一些未来的研究方向,以给读者提供参考。
02
数据特征和挑战
推荐系统通常涉及多种不同的客体,比如用户,物品,属性,以及上下文等。所有这些客体都通过不同类型的关系相互关联,如用户之间的社交关系,用户与物品间的交互关系,从而生成了不同类型的图。在这一节,我们首先根据数据的来源和特征对推荐系统中涉及的不同类型的数据进行分类。对于每一类数据,我们先系统地分析它们的特征,然后讨论怎样用图来更好地表征他们,最后指出这些特征给构建基于图学习的推荐系统所带来的主要挑战。
一般而言,推荐系统中的数据主要可以分为用户—物品交互数据(如用户对物品的打分或点击),和附带信息(如用户和物品的属性信息)。而交互数据又可以简单地划分为一般的无序交互数据和序列交互数据。基于此,我们把推荐系统涉及到的数据大致分为以下三类:(1)一般交互数据;(2)序列交互数据;(3)附带信息。每一类又可以分为若干子类。下列表Table 1 对数据分类,表征每一类数据所用的图,以及相对应的典型的推荐系统算法进行了总结。
03
基于图学习的推荐系统方法
在这一节,我们介绍基于图学习推荐系统的最新进展。具体而言,我们介绍了能为第2节中讨论的挑战提供解决方案的图学习的技术和方法,每一类方法都被用来构建了相应的图学习推荐系统。我们首先从技术的视角对这些图学习推荐系统的方法进行了分类,然后讨论每一类方法的要点以及所取得的主要进展。
下列图Figure 2 展示了基于图学习推荐系统方法的分类。这些图学习推荐系统方法被划分为3类:(1)基于随机游走模型的方法;(2)基于图嵌入技术的方法;和(3)基于图神经网络的方法。每一类又可能包含若干子类。
04
算法和数据集
为了方便读者进行基于图学习推荐系统方面的深入研究,我们收集和整理了一些经典的图学习推荐系统开源算法和一些常用的用以验证基于图学习推荐系统性能的公开数据集,并提供了开源链接。开源算法和公开数据集分别列于下表 Table 2 和Table 3当中。
05
未来研究方向
我们基于前文分析出的挑战和该领域内目前已经取得的进展,总结出了以下四个未来值得研究的方向供读者参考: (1)基于动态图学习的自进化推荐系统 (2)基于因果图学习的可解释推荐系统 (3)基于多重图学习的跨域推荐系统 (4)基于大规模图学习的高性能在线推荐系统
06
结论
作为人工智能最重要的应用之一,推荐系统几乎存在于我们日常生活的各个角落。作为人工智能最具有前景的技术之一,图学习在学习推荐系统中的各类客体间复杂关系上表现出了强大的优势。这促成了一个全新的推荐系统范式:基于图学习的推荐系统,它成为下一代推荐系统的潜力巨大。我们希望这篇综述给学术界和工业界的人士提供了一个关于基于图学习推荐系统的挑战,最新进展以及未来方向的全面概述。
参考文献(原文):
Shoujin Wang, Liang Hu, Yan Wang, Xiangnan He, Quan Z. Sheng, Mehmet Orgun, Longbing Cao, Francesco Ricci, Philip S. Yu. Graph Learning based Recommender Systems: A Review. IJCAI 2021.