SIGIR2021 | 基于排序的推荐系统度量优化新视角

2021-12-06 14:40:35 浏览数 (1)

本文分享一篇SIGIR’21的推荐系统文章:基于排序的推荐系统度量优化新视角。

论文下载地址:https://arxiv.org/pdf/2106.02545.pdf

动机

直接优化信息检索常用指标已经成为设计基于排序的推荐系统的一种有前景的方式。现有的大多数方法认为直接优化评测所用指标会得到更好的性能。但是,另一部分研究认为这样一种假设存在问题。因此,本文中,作者针对优化指标的选取对于基于排序的推荐系统的性能影响进行研究。分别在pairwise和listwise learning to rank (LTR)场景下进行了大量的实验。通过四个数据集上的实验结果得到了以下观点:

  • 使用同样的指标进行优化和评测基于排序的推荐系统并不总能得到最好的推荐性能。
  • 基于RBP损失相较于其他评测指标总能获得最好的性能,RBP有望成为LTR推荐场景下可替代的损失。
  • 基于RBP的listwise优化对于活跃用户性能提升大于非活跃用户。

方法

预备知识

假设用户数目为M ,物品数目为NU-I 交互矩阵为mathbf{Y} in {0,1}^{M times N} (本文考虑二元交互数据),任意一个用户u 都有m_u 个交互过的物品。本文采用矩阵分解模型作为推荐模型,其中用户和物品分别被隐因子矩阵mathbf{U}^{Mtimes D}mathbf{V}^{Vtimes D}

表示,其中D 是隐因子维度。利用用户和物品的隐向量得到预测矩阵mathbf{F}^{M times N} ,其中f_{ui} 代表用户u 对物品i 的预测分数。因此排序位置R_{ui}

mathbb{I}(bullet)为指示函数。

度量方式

在详细描述算法之前,介绍信息检索中常用的四个评测指标:RR, nDCG, RBP, AP,定义如下:

根据RBP的定义,p in (0, 1) 是一个常数,p 越大说明用户更愿意挖掘排序列表中排名靠后的物品,反之,用户仅关注排名靠前的物品。为了与其他指标的范围对齐,作者对RBP进行归一化:

其中Z(p, m_u)=1/(1-p^{m_u}) 为归一化因子。

成对度量优化

对于pairwise指标优化方式,作者选择LambdaRank [1] 作为排序模型。对于RR, AP和nDCG的lambda 优化,参考方法 [2],而使用LambdaRank优化RBP的方法之前从未有过,因此本文中详细介绍。给定一个用户ulambda 优化一个物品对(i, j) 的损失为:

其中S_{uij} 等于1或-1取决于真实标签y_{ui} 是否比y_{uj} 大,o_{uij}=f_{ui}-f_{uj} 表示两个物品的预测分数之间的差值。损失对于o_{uij} 的偏导数为:

为了奖励正样本惩罚负样本,lambda 梯度定义为:

列表度量优化

pairwise方法可以轻松的避免优化指标的不平滑问题,但是在listwise方法中这一问题仍未被解决。能够成功解决这一问题十分重要是因为优化过程更加直观直接。评测指标难以优化的直接因素是因为指示函数的存在,为了统一对比,作者利用sigmoid函数替代指示函数。

因此,RR,nDCG,AP,RBP改写为:

由于对数函数的单调性,

再根据Jensen不等式得到上述的下界:

由于p in (0, 1) , In(p) 为负数,因此极大化上述公式等价于极小化sum_{i=1}^N y_{ui}(widetilde{R}_{ui}-1) 。最后得到归一化的nRBP损失为:

实验

数据集

度量指标

0 人点赞