SIGIR'22 推荐系统论文之序列推荐(长文)篇

2022-08-02 14:29:01 浏览数 (1)

SIGIR 2022已公布录用论文,投稿长文794篇/短文667篇,录用长文161篇/短文165篇,录用率长文20%/短文24.7%,完整录用论文列表见https://sigir.org/sigir2022/program/accepted/。

[1] [2]已对推荐系统相关论文进行梳理,本文选择序列推荐方向的Full Papers进行解读。(晚上出去聚餐,没时间长短文一起,下一篇再解读短文)

第一篇是解耦,第三篇是结合,怎么发论文,你学会了吗?

论文解读

1. Decoupled Side Information Fusion for Sequential Recommendation

论文链接: https://arxiv.org/pdf/2204.11046

代码链接: https://github.com/AIM-SE/DIF-SR

论文机构: 港科大、Upstage

论文分类: 序列推荐

论文总结: 在序列推荐中融合各种辅助信息旨在更准确的预测下一个商品,当前大多数方法都采用自注意力网络,并专注于探索各种解决方案,以在注意力层之前集成商品embedding和辅助信息embedding。然而,作者分析表明,由于秩瓶颈 (rank bottleneck),各种embedding的早期集成限制了注意力矩阵的表达能力,并限制了梯度的灵活性。此外,它涉及不同异构信息资源之间的混合相关性,给注意力计算带来了额外的干扰。受此启发,本文提出了序列推荐的解耦辅助信息融合方法 (Decoupled Side Information Fusion for Sequential Recommendation,DIF-SR),它将辅助信息从输入层移动到注意力层,并将各种辅助信息和商品表示的注意力计算解耦。作者从理论上和经验上表明,所提出的解决方案允许更高秩的注意力矩阵 (higher-rank attention matrices)和灵活的梯度来增强辅助信息融合的建模能力。此外,本文还提出了辅助属性预测器 (auxiliary attribute predictors)以进一步激活辅助信息和商品表示学习之间的有益交互。对四个真实世界数据集的广泛实验表明,本文提出的解决方案稳定地优于最先进的序列推荐模型,并可以很容易地融入当前基于注意力的序列推荐模型并显著提高性能。

2. Multi-Agent RL-based Information Selection Model for Sequential Recommendation

论文链接: 无

论文分类: 强化学习、序列推荐

3. When Multi-Level Meets Multi-Interest: A Multi-Grained Neural Model for Sequential Recommendation

论文链接: https://arxiv.org/pdf/2205.01286

代码链接: https://github.com/WHUIR/MGNM

论文机构: 武大、快手

论文分类: 序列推荐

论文总结: 序列推荐旨在根据用户的历史行为来推断用户偏好的下一个商品。与利用注意力机制和 RNN 的传统序列模型相比,最近的努力主要遵循两个改进方向:多兴趣学习和图卷积聚合。具体来说,像 ComiRec 和 MIMN 这样的多兴趣方法专注于通过执行历史商品聚类来为用户提取不同的兴趣,而包括 TGSRec 和 SURGE 在内的图卷积方法则选择基于历史商品之间的多层次相关性来细化用户偏好。不幸的是,他们都没有意识到这两种类型的解决方案可以相互补充,通过聚合多级用户偏好来实现更精确的多兴趣提取以获得更好的推荐。为此,在本文中,作者通过结合多兴趣学习和图卷积聚合提出了一个统一的多粒度神经模型 (multi-grained neural model,MGNM)。具体来说,MGNM首先为用户学习历史商品的图结构和信息聚合路;然后它执行图卷积以迭代方式获得商品表示,可以很好地捕获不同层次的复杂偏好。随后,作者提出了一种新的序列胶囊网络 (sequential capsule network),将序列模式注入多兴趣提取过程,从而以多粒度方式实现更精确的兴趣学习。对来自不同场景的三个真实世界数据集的实验证明了 MGNM 相对于几个最先进的基线的优越性。就 NDCG@5 和 HIT@5 而言,最佳基线的性能增益分别高达 3.12% 和 4.35%,这是最近发展的序列推荐的最大增益之一。进一步的分析还表明,MGNM 在多粒度级别的用户偏好理解方面是稳健且有效的。

4. Ada-Ranker: A Data Distribution Adaptive Ranking Paradigm for Sequential Recommendation

论文链接:

https://www.microsoft.com/en-us/research/uploads/prod/2022/05/sigir2022_adaranker.pdf

代码链接: https://github.com/RUCAIBox/Ada-Ranker

论文机构: 人大、微软亚研

论文分类: 序列推荐、动态排序

论文总结: 大规模推荐系统通常由召回和排序模块组成。排序模块的目标是精细地区分用户对召回模块提出的候选商品的偏好。随着深度学习技术在各个领域的成功,我们见证了主流排序模型从传统模型演变为深度神经模型。但是,我们设计和使用排序模型的方式保持不变:离线训练模型,冻结参数,并将其部署到在线服务。实际上,候选商品是由特定的用户请求决定的,其中潜在的分布 (例如,不同类别的商品比例,流行或新商品的比例)在生产环境中彼此之间存在很大差异。经典的参数冻结推理方式无法适应动态服务环境,使得排序模型的表现受到影响。

在本文中,作者提出了一种新的训练和推理范式,称为 Ada-Ranker,以应对动态在线服务的挑战。Ada-Ranker 可以根据当前候选商品组的数据分布自适应地调整 ranker 的参数,而不是使用参数冻结模型进行通用服务。Ada-Ranker首先从候选商品中提取分布模式;然后,通过模式调整排序模型,使排序模型适应当前的数据分布;最后,使用修改后的排序模型对候选列表进行评分。通过这种方式,排序模型具备从全局模型自适应地转换为更好处理当前任务局部模型的能力。作为第一次研究,作者在序列推荐场景中验证Ada-Ranker 范式,在三个数据集上的实验表明,Ada-Ranker 可以有效地增强各种基本序列模型。

5. Multi-Behavior Sequential Transformer Recommender

论文链接: 无

论文分类: 序列推荐、Transformer

6. Determinantal Point Process Set Likelihood-Based Loss Functions for Sequential Recommendation

论文链接: https://arxiv.org/pdf/2204.11562

代码链接: https://github.com/l-lyl/DPPLikelihoods4SeqRec

论文机构: 澳国立

论文分类: 序列推荐、多样性、损失函数、DPP

论文总结: 序列推荐的目标是根据用户之前的动作序列预测用户的下一个动作。在推荐系统的训练过程中,损失函数在指导推荐模型的优化为用户生成准确的建议方面起着至关重要的作用。然而,大多数现有的序列推荐技术都集中在设计算法或神经网络架构上,很少有人专门设计适合序列推荐系统实际应用场景的损失函数。

基于排序的损失函数,例如交叉熵和贝叶斯个性化排序 (Bayesian Personalized Ranking,BPR),广泛用于序列推荐领域。这样的目标函数有两个固有的缺点:i)在这些损失公式中忽略了序列元素之间的依赖关系;ii) 过分强调只产生准确的结果,而不是平衡准确性 (质量)和多样性。因此,本文提出了两个基于决定点过程 (Determinantal Point Process,DPP) 似然的新损失函数,可以自适应地应用于估计后续商品。DPP 分布式商品集捕获时序动作之间的自然依赖关系,并且 DPP 内核的质量与多样性分解推动我们超越以准确性为导向的损失函数。在三个真实世界数据集上使用所提出的损失函数的实验结果表明,在质量和多样性指标上都比最先进的序列推荐方法有显著改进。

参考文献

[1] SIGIR 2022 | 推荐系统相关论文分类整理

[2] SIGIR 2022 推荐系统论文整理分类

0 人点赞