今天给大家简要分享的是发表在SIGIR2022会议上的一篇关于冷启动推荐算法的短文,其核心思想是通过设计基于上下文的自适应嵌入算法来抵消特征分布的差异,以此将冷启动用户的特征嵌入转化为与现有“热”用户相似的特征状态,进而表示相应的用户偏好。
对数据有限的冷启动用户进行有效推荐是一个固有挑战。现有的深度推荐算法利用用户的内容特征和行为数据来产生个性化的推荐列表,但由于存在以下挑战,使得在冷启动用户身上往往面临着显著的性能下降:(1)冷启动用户可能与现有用户存在非常不同的特征分布。(2) 冷启动用户的少量行为数据很难被算法有效且高效利用。基于此,本文提出了一个名为Cold-Transformer的推荐模型来缓解以上问题。
图1:本文提出的基于双塔框架的模型示意图。首先,用户的原始嵌入从非序列特征中提取出来。然后,嵌入适应层聚合用户原始嵌入的上下文信息,以此输出自适应的上下文感知用户嵌入。最后,根据给定的物品以及当前用户进行评分,以此来预测点击率。
具体来说,本文设计了一个基于上下文的嵌入自适应模块来抵消特征分布的差异。它将冷启动用户的嵌入转化为类似于正常用户的特征状态,以代表相应的用户偏好。此外,为了利用冷启动用户的少数行为数据并表征用户上下文,本文建议同时用标签编码对正负反馈的融合行为进行建模,因为这将编码更多的行为信息。最后,为了进行大规模的工业推荐任务,本文基于双塔结构,将用户和目标物品进行解耦。在公开的(Movielens)和业界数据集(Taobao等)上进行的大量实验表明,Cold-Transformer明显优于最先进的方法。
感兴趣的读者可阅读原论文进行深入阅读。
论文地址: https://dl.acm.org/doi/pdf/10.1145/3477495.3531797