论文地址:https://dl.acm.org/doi/pdf/10.1145/3383313.3412238
研究:可以扩展为向用户推荐其它业务中的好商品,而不再局限于用户之前看过的本业务内的各种类型商品,可提升推荐商品的novelty和diversity。
一、目标
加强推荐系统惊喜度,在传统推荐的基础上加入新鲜和未探索内容的推荐来提升用户惊喜体验
二、简介
1.PURS模型将惊喜度因素纳入推荐系统
2.在个性化推荐方面主要使用自注意力机制
3.基于会话的惊喜度感知因素
4.惊喜度计算:一个新item和潜在的用户兴趣群之间的距离
5.提出了一种新的激活函数,据说对于惊喜度指标非常有帮助
6.使用了3个数据集(Yelp,Youku,MovieLens)进行离线实验,在线A/B Test,证明了PURS模型的优势。
三、创新点
1.惊喜度Unexpected的引入
2.Unexpected 激活函数
3.个性化与基于会话的兴趣因子
4.基于行为序列的兴趣聚类
根据用户历史观看记录在embedding空间进行兴趣的聚类,形成若干个兴趣群,就像下图所展示的这样,在通常情况下对用户观看记录进行embedding之后形成的向量空间分布如图(a)中所示,红点表示一个人的兴趣分散在这个空间中。然后我们使用这些点作为同一个兴趣,找到它们的中心点,画一个大圈。就原文的意思,这样画出来的兴趣范围不够准确,因为人的兴趣是多样性的,画一个大圈会把很多无关的兴趣容纳进来。所以本文提出了一种兴趣聚类的方式,缩小了聚类的范围,在原来中心点的基础上,构建出一些小的兴趣圈,以让兴趣表达更加精确。
四、模型架构
1.模型架构图
接下来我们尝试来看一下模型架构。
在整个架构里分成了两个大模型,左边是base模型,这个就非常传统,使用了Self-Attentive GRU来学习用户历史行为,然后使用MLP叠加用户和item特征。右边是新增的惊喜度模型,这里面比较特别的就是激活函数和使用历史行为计算的兴趣聚类。这两个模型分别跑完,最后使用混合效用函数把结果结合在一起。
2.混合效用函数
3.unexpected激活函数
五、评估指标
接着我们看一下评估指标。这里面使用的评估指标还是挺齐全的。
1.AUC
第一个AUC就不说了,这个大家应该都很熟悉。
2.HR@10(Hit Ratio)
分母是所有的测试集合,分子是每个用户前K个中属于测试集合的个数的总和,该指标衡量是召回率,该指标越大越好
3.Unexpected
用户对推荐系统的超预期体验
4.Coverage
关于覆盖率的定义,最简单的理解是推荐系统能够推荐出来的物品,占平台中全部物品的比例。
六、结果
关于结果,那当然是表现不错。这里作者使用了三个数据集,其中两个Yelp和MovieLens是公开数据集,还有一个是Youku自己的数据集,使用了上述指标并且与很多已有的模型进行了效果的评估。
对比的CTR模型有DIN,DeepFM,Wide&Deep,PNN,对比的带有惊喜度优化的模型有HOM-LIN,Auralist,SPR,DPP,具体的指标可以自己看一下。、
鉴于我的理解能力,如果有什么理解错误,欢迎大家留言讨论~~~
对了,我还建了一个Git项目,论文都丢在里面:
https://github.com/icegomic/GomicDatamining