文章目录
- 1 理论
- 1.1 BG / NBD概率模型介绍
- 1.2 Gamma-Gamma模型
- 2 实践案例
- 2.1 lifetimes实践案例一:在线零售业务的交易
- 2.1.1 数据解读
- 2.1.2 BG / NBD - 预期交易的frequency /recency 热力图
- 2.1.3 顾客留存概率热力图
- 2.1.4 评估模型效果方式一:模型验证重复购买频率
- 2.1.5 模型训练
- 2.1.6 预测结果
- 2.1.7 客户交易预测
- 2.1.8 客户概率历史
- 2.1.9 gamma-gamma模型估算客户终生价值
- 2.1.10 模型相关性
- 2.1.10 gamma-gamma模型训练
- 2.1.11 使用DCF method计算CLV
- 2.2 BG-NBD模型用于客群分析
- 2.2.1 数据载入
- 2.2.2 [宏观] 流失率p- beta分布求解
- 2.2.3 [宏观] 整体用户预测销量
- 2.2.4 [微观] 每个用户交易次数的条件预测
- 2.1 lifetimes实践案例一:在线零售业务的交易
- 3 Lifetimes package的介绍
- 3.1 函数:summary_data_from_transaction_data
- 3.2 标准建模数据样式
- 参考文献
目前该系列的几篇:
用户增长——CLV用户生命周期价值CLTV 笔记(一)
用户增长 - BG/NBD概率模型预测用户生命周期LTV(二)
用户增长——Cohort Analysis 留存分析(三)
1 理论
1.1 BG / NBD概率模型介绍
数据运营36计(六):BG/NBD概率模型预测用户生命周期LTV,Python实现
用户存续期价值评估(CLV) 一
想象你有一批客户,可能会重复购买,有些频繁一些而有些不太频繁。对于预测CLV来说,你希望知道哪些客户是活跃的,会继续从你这里购买产品;每个客户会购买多少? 为这些问题建模看似简单实则非常困难。 比如说,一个客户以前每天都在你这里购物,但有一个星期没有购物了,这很可能表示这个客户已经流失了;而另一个客户每月购买一次,在同样情况下就不会被认为是流失了。也就是说,流失率和购物频率是非常相关的。 其难点在于,我们很难观测到任意客户的流失瞬间,只能对其进行概率建模。
要预测由客户带来的收入,一般会把与客户的业务模型分为有合同的和无合同的、连续的和离散的。
本篇讨论应用最为广泛的适用于 无合同连续业务模型
的概率模型:
- Pareto/NBD (negative binomial distribution) 模型
- 其增强版本BG(Beta Geometric)/NBD模型 - 非契约客户关系情境下重复购买行为(需要购买次数 > 1)
这里注意:
- 有合同与无合同(或者有合约 / 无合约),比如,合约在国内最有代表的是合约手机。一般互联网产品,合约形态较为少见。CLV 的产品形态要求非合约。
BG/NBD模型又称为贝塔几何/负二项模型,BG/NBD 是一个经典模型改进型,详细的数学论证参见:A Note on Deriving the Pareto/NBD Model and Related Expressions
BG/NBD模型是用于描述非契约客户关系情境下重复购买行为。
即用户可以随时购买产品,无时间约束。该模型可利用用户历史交易数据(RFM)来预测未来每个用户的交易次数和流失率。
该模型的几个假设前提:
(1)【交易假设】用户在活跃状态下,一个用户在时间段t内完成的交易数量服从均值为λt的泊松分布。
在一年中的每个月,客户都以抛硬币的方式来决定是否购买。我们所观察到的购买次数取决与泊松分布的参数