WWW'22|用于分布外推荐的因果表征学习

2022-06-06 08:31:49 浏览数 (3)

  • 论文地址:https://dl.acm.org/doi/10.1145/3485447.3512251

简介

现代推荐系统从历史交互中学习用户表征,这就存在着用户特征变化带来的问题,比如收入的增加。历史交互会将过时的信息注入到与最新的用户特征相冲突的表示中,从而导致不恰当的推荐。在这项工作中,作者考虑了在用户特征发生变化的Out-Of-Distribution (OOD) 环境中的推荐问题,并为表征学习设定了额外的两个目标:强大的OOD泛化能力以及快速的OOD适应能力。OOD场景的推荐问题如图所示:

这项工作从因果关系的角度阐明并解决了这个问题。作者将用户特征的转变表述为一种干预措施,将OOD推荐表述为交互概率的干预后推断,并采用了因果模型为用户特征到交互结果的生成过程建模。作者设计了一个新型变分自动编码器来进行因果建模,利用编码器从历史上的互动中推断出未观察到的用户特征,利用解码器来对交互的生成过程进行建模并进行干预后推断,并且进一步进行反事实推理,来减轻过时的交互的影响。固有的快速的OOD适应能力来自于部分用户表征的再利用。变分自动编码器结构如图所示:

最后,作者设计了一个扩展的因果图,对从用户特征到用户偏好的细粒度因果关系进行编码。在三个数据集上的实证结果验证了所提方法的强大OOD泛化和快速适应能力。

问题定义

首先通过因果关系的视角定义推荐问题,包括了用户交互的生成过程的因果视角和对OOD推荐问题的规范。用户交互生成的因果关系图如图所示:

方法

作者提出了Causal OOD Recommendation(COR)框架为交互的生成过程进行建模来解决用户特征变化后的OOD场景下的推荐问题。相对的,用户变化前的环境即传统的训练环境(拥有用户特征与对应的历史交互信息)被称作Independent and Identically Distribution (IID)环境。

1. 目标函数

2. 实现方法

3. 因果推断方法

4. OOD环境的微调

在用户特征发生变化后,会逐渐获取新的历史交互信息d 。在OOD环境中,重复利用用户特征没有发生变化时的z2 ,并微调模型更新OOD环境下的用户偏好z1 为用户做OOD环境下的推荐。由于作者所提出的模型是基于因果关系建立的,因此在用户特征发生变化后,该模型会有更稳定的推荐表现并且在OOD环境中需要更少的交互信息

来调微调。

实验

  • 作者在三个数据集上验证了COR的强大OOD泛化能力,在不同数据集下IID和OOD环境下模型的表现如图所示:

image-20220510012240339

可以看到在OOD环境下,COR的召回率相比最高的基准模型提升了超过34%,同时在IID的环境下与基准模型具有相近的表现,从而验证了COR框架的较强的OOD泛化能力

  • 而对于第二个OOD推荐任务的目标即快速适应能力,作者也在不同数据集上进行了验证,如图所示:

image-20220510013141360

通过对比在用户特征发生变化后的OOD环境下,分别对没有最新交互信息(0%),和10%,20%以及30%的最新交互信息微调在IID上预训练好的模型。实验结果验证COR框架能够让模型拥有很快的OOD适应能力

  • 反事实推理和细粒度因果图的消融实验:
  • 案例分析:在IID环境中用户收入较低,真实消费更偏向于低价产品,而在OOD环境中用户的收入较高,真实消费更偏向于高价产品。IID和OOD环境下不同模型为用户推荐的产品在价格的分布如下图所示:

可以看到COR推荐的分布最逼近不同环境下的真实交互产品分布。

结论

作者提出且规范了用户特征发生变化的OOD推荐问题。为了达到较强的OOD泛化能力和快速的OOD适应能力,作者提出了COR框架,从因果关系的视角为用户的交互过程进行建模,利用干预和反事实推理减轻了OOD环境中过时的交互信息对推荐结果的影响。此外,通过在OOD环境的微调,推荐模型能够快速适应并给出更恰当的推荐。

0 人点赞