近几年,基于图嵌入技术的推荐系统已成为一个热门的研究焦点,并将随着图嵌入技术的不断发展而持续。近日发布的《基于图嵌入技术的推荐系统》长文综述,系统地阐述了二部图、广义图和知识图谱上的图嵌入技术,以及将它们应用到对应推荐场景中的推荐模型。同时还在传统推荐(例如UBCF、IBCF这类直接作用在网络拓扑结构上进行分析的、非机器学习的推荐模型)和基于图嵌入的推荐之间通过实验进行了比较,提出了在两者间进行权衡的策略和在两者间进行融合的新观点。
论文地址:https://arxiv.org/pdf/2109.09587
大数据对用户的生活有益吗?大多数人或许会异口同声道:always! 确实,从这次疫情期间的国家防控工作中就能切身感受到,交通大数据能够极大地帮助我们挖掘出可能存在的潜在感染者。对于科研工作,学术大数据也能促进研究人员之间的合作。此外,在日常生活中,平时为我们带来娱乐和便利的百度和淘宝等等,无一不是背后的多媒体大数据在支撑其高效的运作。然而,让我们更加辩证地来看待这个问题:大数据难道就不会对用户的生活带来不利影响吗?回想一下,我们没有过在百度视频上半天也刷不到自己感兴趣的短视频而消耗无效时间的捉急吗?我们没有过在淘宝上半天也找不到自己喜欢的商品而不得不翻来翻去的不甘吗?大数据在数量上的大规模、种类上的多样化以及质量上的层次不齐也会降低用户对有效信息的检索效率,增加用户的时间开销。这就是大数据时代背景下的“信息过载”难题。
为了解决这一难题,推荐系统是一个有力的工具。它的目标是为用户从大数据中自动筛选出感兴趣的内容。说到这里,我们或许能够突然意识到:推荐系统早已融入了我们的生活中,比如能够为我们自动推荐感兴趣的短视频的抖音,或者是出现在淘宝首页的“您可能感兴趣的物品”等。更进一步地,推荐系统的原理就是通过分析用户和物品(比如短视频、商品等)已有的交互记录(如:点击、观看和评分等),推断出用户对物品的偏好,从而利用用户偏好来匹配到用户感兴趣的物品,最终实现推荐。
然而,仅利用用户和物品已有的交互记录来进行推荐有两个显而易见的弊端:
(1)用户不可能与上亿级的每个物品都发生过交互,现实是用户和物品间的交互数往往会特别稀疏,导致推荐系统在基于不充足的用户-物品交互记录进行分析而推断出的用户偏好没那么准确。这就是推荐系统面临的第一个典型的难题——“稀疏性”难题。
(2)更坏的情况是,对于刚进入到推荐系统中的新用户或新物品,它们还没来得及与其他任何的物品或用户有过交互,使得连最基本的用于推荐系统分析的原料都缺失了。这就是推荐系统面临的第二个典型的难题——“冷启动”难题。
为了解决上述两类难题,利用边信息和知识作为用户-物品交互记录的补充,来挖掘出更多的潜在的用户-物品关联,从而丰富用于推荐系统分析的原料,已成为近年来的一个趋势,并被证明是有效的。边信息和知识往往具有超大的数据规模和超高的语义复杂度,因此对推荐模型的可扩展性,即在大规模高复杂度数据上运行的效率和表现效果,有着极高的要求。
纵观推荐系统这十几年的发展,可谓是“从网络拓扑结构分析到机器学习、从传统推荐到基于图嵌入的推荐、从仅利用用户-物品交互记录到融入边信息和知识、从模型准确性延伸出对模型可扩展性等的要求”。在此趋势下,基于图嵌入的推荐系统是否就可以取代传统推荐呢?本文从理论上比较了这两者间的优劣势,总结为如下图所示。
此外,本文还在这两类推荐中挑选出最具代表性的推荐模型用于仿真对照实验,得出它们在6个不同任务下(由3组数据分别导出的显示/隐式用户-物品交互预测任务)的推荐准确性表现。实验得出的结论是:在隐式用户-物品交互预测任务中,传统推荐整体上仍优于图嵌入的推荐。
综上,本文得出的结论为:传统推荐侧重于直接分析图拓扑结构,而基于图嵌入技术的推荐则更侧重于复用学习到的表示向量。相比于仅关注其一,将二者的思想进行结合,或将更能够促进推荐系统的发展。 几年来,也有不少研究将网络拓扑结构中的模体、社团等子图用于指导基于图嵌入技术的推荐,如随机游走和图神经网络的信息传递规则等。
为了推动这一趋势,本文号召来自不同学科领域的研究人员开展交叉研究合作。对此,关于传统推荐和基于图嵌入技术的推荐的详尽的综述是实现如此沟通的桥梁。虽然前者已具备,但纵观近几年发表的综述后,发现后者仍缺失。本文旨在对其进行弥补,分别从二部图、广义图和知识图谱的视角系统地综述了图嵌入技术及相应的推荐模型,总结为下面三张图所示。
基于二部图嵌入推荐系统发展历程
基于常规图嵌入推荐系统发展历程
基于知识图嵌入推荐系统发展历程
以及对它们各自的优势和劣势进行了总结比较,如下图所示:
同时,为了更有效地对这些框架下的推荐模型进行全新的建模,推动领域的发展,本文还提出了一个用于基于图嵌入技术的推荐系统的建模方案。其结合了计算机科学家偏向的“从数据(任务)出发”的角度和物理学家偏向的“从通用性出发”的角度,如下图所示。该建模方案中也涵盖了推荐系统,包括传统推荐和基于图嵌入技术的推荐,的连贯运行流程:输入信息、构造图表示、设置相似性度量、选定推荐方法和构造推荐模型。本文认为,推荐模型的建模过程应是上述整套流程的体现。
本文系统性的分析与总结了基于图嵌入技术的推荐系统相关文献,并基于既有实验提出了自己的结论与观点。文中若有不妥之处以及需要改进的地方,欢迎同行提出宝贵意见与建议。