点击关注我们,提升学习效率
title:SimpleX: A Simple and Strong Baseline for Collaborative Filtering
link:https://dl.acm.org/doi/pdf/10.1145/3459637.3482297
from:CIKM 2021
1. 导读
协同过滤(CF)一般包含三个部分:交互编码器、负采样和损失函数。现有的大部分工作集中在设计更强模型上,对负采样和损失函数的改进的相关工作比较少。相较于交互信息的编码而言,另外两者也同样重要,本文作者提出了一个新的损失函数 cosine contrastive loss (CCL) ,将其合并到统一的CF框架中,命名为simpleX 。
2. 方法
虽然已经存在BPR,BCE,softmax loss等损失函数,但是它们之间仍然缺乏系统的比较,使得它们对模型性能的影响没有得到很好的理解。作者在文中对比了不同的损失函数,并提出了新的损失函数CCL。
2.1 Cosine Contrastive Loss
给定正样本用户-商品对(u, i),和一些随机采样得到的负样本集合N,CCL可以表示为下式,其中y表示u,i表征的余弦相似度。m属于0~1是边距阈值,用于过滤负样本。含义:CCL被优化以最大化正对之间的相似性,并最小化边距约束下的负对的相似性.