关注我们,一起学习~
title:A Counterfactual Modeling Framework for Churn Prediction link:https://dl.acm.org/doi/pdf/10.1145/3488560.3498468 from:WSDM 2022 code:https://github.com/tsinghua-fib-lab/CFChurn
1. 导读
本文针对用户流失预测提出结合因果推断的方法CFChurn。结合反事实推理,捕获社会影响的信息从而对流失进行预测。
- 首先构建两个embedding,分别表示用户的内在意图和外在社会影响。
- 然后进行反事实数据增强,通过提供部分标记的反事实数据为模型引入因果信息。
- 最后通过三头反事实预测框架来引到模型学习因果信息,对用户流失进行预测。
主要思想:将用户流失的原因归结为用户自己意图和外界影响两方面,然后通过反事实数据增广从原始观察数据中得到反事实数据,最后对原始数据和反事实数据进行预测,并结合一些约束。具体见下文。
2. 定义
流失预测的目标是预测用户在未来一段时间内是否会停止使用服务或平台。模型包括三个输入,记录了用户信息和历史行为的用户特征矩阵
(N个用户),记录了用户之间交互的交互特征矩阵
(K种交互),和社会网络G。输出为在未来一段时间内是否会流失,公式如下,
社交网络G以用户为节点,用户交互为边,
,邻接矩阵
,用户特征即为节点特征,交互特征即为边特征。
3. 方法
一般来说,用户流失的原因主要有两种。一个源于人的内生意图,例如,一个人对服务失去兴趣。另一个来自一个人的社会关系的社会影响,这是外生的。例如,一个人可能会停止使用某项服务,因为当他/她的大多数朋友停止使用某项服务时,他/她会感到压力。使用因果图来说明,构建如图 1(a) 来反映两个原因和客户流失之间的因果关系。
基于这个因果图构建模型 CFChurn,其架构如图 1(b) 所示。具体来说,CFChurn结合骨干网络利用两个独立的embedding来模拟用户的内生流失意图和外生社会影响。以两个embedding作为输入,所提出的反事实建模框架包含两个模块:反事实数据增强模块和三头反事实预测模块。
3.1 骨干网络
外生的社会影响和内生的用户意图是用户流失的两大原因。通过两个独立的embedding对它们进行建模,以捕获不同的信息源。作者设计了SGAT来模拟用户之间的关系,以便它学习的embedding可以潜在地捕获社会影响信息。
3.1.1 特征的embedding
模型首先将用户节点特征