0 前言
这是继[Shi et al. 2014]之后又一篇以附加边信息的推荐系统为视角的综述文章《Research Commentary on Recommendations with Side Information: A Survey and Research Directions》,相比于前者主要聚焦在协同过滤技术上利用边信息,而这篇文章更细粒度的介绍了目前利用边信息的推荐模型所用到的技术(基于内容、协同过滤、隐因子模型、表示学习和深度学习技术),以及更细化对于边信息的分类(结构信息与非结构信息),可以通过该文了解主流以及前沿的推荐算法,无聊的时候可以康康。
其实综述不仅起到索引的作用,我觉得更大的作用是给我们一个别人(牛人)视角中的知识体系(框架),然后通过借阅牛人的综述来Fine tune自己的知识网络(而非reconstruct自己的网络),以此来更丰富自己的知识库。
1 摘要
推荐系统已成为近几十年来帮助解决信息过载问题的重要工具。但是,传统的推荐系统存在数据稀疏和冷启动问题。为了解决这些问题,已经提出了大量推荐算法以利用用户或物品(例如,社交网络和物品类别)的辅助信息,从而在提高推荐性能方面表现出高度的有效性。本综述旨在对带有辅助信息的推荐系统的最新研究提供全面而系统的调研。具体而言,从两个正交的角度概述了具有辅助信息的最新推荐算法。一种维度是涉及不同的推荐方法:基于内存的方法、潜在因子模型,表示学习和深度学习模型。另一个维度则涵盖了辅助信息的不同表示形式,包括结构数据(平面,网络和层次结构特征以及知识图);和非结构化数据(文本,图像和视频功能)。最后,我们讨论了挑战并在建议中提供了新的潜在方向。
2 特色
该文旨在通过考虑辅助信息的表示方法和基本推荐方法,为研究社区提供有关推荐领域当前进展的全面而系统的概述。它不仅关注一些前沿技术(例如知识图和深度学习模型),而且还关注其他常规技术(例如社交网络和潜在因子模型),这些技术已成为推荐系统开发的基础信息。通过这种方式,该综述为本领域的研究人员和从业人员提供了完整的框架体系。
3 主要内容
该文的主要结构如下图所示。
首先,该文概述了附加边信息推荐系统的进展,其中包括对于推荐系统的概述,传统方法来做推荐的进展以及利用边信息来进行推荐的研究进展。
① 在推荐系统的概述中,该文通过三种视角将推荐系统进行了分类,从策略角度分为了(基于内容的过滤方法、协同过滤的方法和混合的方法),从任务的角度分为了(一般的任务、时序的任务和序列的任务),从输入的角度分为了(评分预测和项目排序)。
② 在传统推荐方法进展介绍中,将推荐技术分为了以下4个阶段,分别是基于记忆的模型(User-oriented和Item-oriented)、隐因子模型(PMF和FM)、表示学习方法(Item2vec)和深度学习方法(MLP、CNN等)。
③ 在利用边信息进行推荐的研究进展介绍中,该文将边信息分为了两大类数据(结构化数据和非结构化数据)。其中结构化数据包括(扁平特征、层次特征、网络特征和知识图),非结构化数据则包括(文本特征、图像特征和视频特征)。
然后,详细介绍了利用传统模型来引入边信息的方法,其中包括基于记忆的方法、隐因子模型以及表示学习的方法。
① 早期的利用边信息进行推荐的方法主要是建立在基于记忆的方法上边,典型的研究包括用户的边信息(social networks)和项目的边信息(item categories)。
② 由于隐因子模型(比如MF,WNMF,BPR,FM等模型)具有推荐性能好、效率高的原因,后期利用边信息进行推荐的方法大部分来自于此。
③ 随着Word2vec技术的发展,表示学习技术开始占据主导。不同于隐因子模型,表示学习技术可以高效的利用局部的项目关系信息进而得到项目的嵌入向量,以此来提高推荐性能,主要的模型包括(Item2vec、Producevec、User2vevc等)方法。
最后,用较大篇幅介绍了利用深度模型来处理边信息的方法,其中包括基本的深度学习模型、另外还介绍了利用深度学习模型来分别引入浅特征、网络结构特征、层次特征、知识图特征、文本特征、图像特征、视频特征等。
在该部分中,分别具体的介绍了深度学习模型Auto-Encoder、MLP、CNN、RNN、GAN、GCN以及Attention机制是如何将各色各样的边信息应用到推荐系统中去的。
3 未来方向
文章最后,讨论了几个关于未来利用边信息进行推荐的研究点,主要包括利用结构化边信息的深度推荐技术、利用众包边信息进行推荐的技术、边信息用于强化和对抗的推荐技术以及利用边信息进行跨域和包推荐领域等。