“推荐系统”加上“图神经网络”

2020-04-21 10:34:22 浏览数 (1)

作者 | Plato

SIGIR'19的一篇论文Neural Graph Collaborative Filtering（NGCF）介绍了用图神经网络（GNN）来增强协同过滤推荐系统的方法。今天我们来聊一聊下面几个话题：

什么是协同过滤？如何用协同过滤做推荐？
NGCF是如何构图的？NGCF在基础的GNN上有哪些改动？如何用NGCF做推荐？

协同过滤

协同过滤（CF）是一种常用的推荐系统做法。协同，指收集广大用户的口味；过滤，指过滤出『我』可能喜欢的物品。这个方法通过收集用户的兴趣和口味，给用户推荐口味相近的人喜欢的物品。

在构建推荐系统的过程中，我们收集了很多用户与物品的交互历史，比如豆瓣电影中用户对电影的打分；淘宝中用户对物品的浏览、购买等。这些交互历史能够表示成一个用户

、物品

的交互矩阵

。

协同过滤模型需要 1. 用向量表示用户的口味

、物品的特性

；2. 通过用户的口味、物品的特性去近似交互历史

；3. 给用户

推荐交互得分最高的物品

。

矩阵分解（MF）是一种基础的协同过滤模型。

MF视频[1]截图，有编辑

MF大致过程如下（另可参考视频[1]）：

将用户看成矩阵

，物品看做矩阵

，

为embedding长度

使用矩阵的乘积

去近似交互矩阵

，使用梯度下降法最小化

，求解

MF的输入单一，不能使用用户与物品的特征作为输入；同时MF对稀疏的交互矩阵效果较差。NGCF作者认为使用GNN能同时解决这两个问题。

GNN使用节点特征作为初始embedding，可以在这里加入用户特征、物品特征；
GNN能够引入『高阶交互历史信息』。

例如『你浏览的这个电影，喜欢它的用户也喜欢以下电影』这种『用户-物品-用户-物品』三阶信息，就是一种『高阶交互历史信息』。这种信息在推荐系统中无疑是非常重要的。

那么作者在论文中如何将GNN加入协同过滤系统的呢？首先，要将历史交互构图；然后，在这个交互图上，使用GNN来嵌入『高阶交互历史信息』，获得节点（用户、物品）的embedding；最后，通过embedding来近似历史交互矩阵

。过程如下：

使用交互历史构图；
在图上，使用GNN学习embedding

；

和MF类似，使用矩阵的乘积

去近似交互矩阵

。

NGCF如何构图？

作者希望使用GNN对高阶交互历史进行建模，就首先要对交互历史进行构图。左图是由用户、物品的交互历史构成的二部图；右图是将左图围绕

展开，获得该点的『高阶历史信息』。

GNN如何获得节点embedding？

在GNN中，节点的embedding初始化成节点的特征，然后通过聚合邻居及自己上一层的

，获得新一层的

。

在NGCF中，第k-1层的节点信息是这样聚合到第k层的：

GNCF的整体网络架构

将每个用户

所有layer的embedding连接起来作为用户最终embedding

将每个物品

所有layer的embedding连接起来作为物品最终embedding

将点积

作为最后的模型预测值

使用了推荐系统常用的pairwise BPR loss，能对正样本和负样本加上不同的权重，使正样本能特别体现用户的口味，负样本能少量体现用户的口味

学到的embedding效果如何？

在用t-SNE降维后，下图是对NGCF与MF的embedding可视化。星星是一个用户，圆圈是一个物品。可以看到NGCF的clusters彼此之间更加分离，即同一个用户交互过的物品，它们的embeddings更加相似。

作者还在Gowalla、Yelp2018、Amazon-Book三个数据集上对比了推荐效果，NGCF均为state of the art。

其他：NGCF作者的论文[2]与实现[3]。

参考

^How does Netflix recommend movies? Matrix Factorization https://www.youtube.com/watch?v=ZspR5PZemcs
^https://arxiv.org/abs/1905.08108
^https://github.com/xiangwang1223/neural_graph_collaborative_filtering

网络安全 https 推荐系统

0 人点赞