用户增长 - BG/NBD概率模型预测用户生命周期LTV(二)

2021-12-07 15:04:39 浏览数 (3)

文章目录

  • 1 理论
  • 1.1 BG / NBD概率模型介绍
  • 1.2 Gamma-Gamma模型
  • 2 实践案例
    • 2.1 lifetimes实践案例一:在线零售业务的交易
      • 2.1.1 数据解读
      • 2.1.2 BG / NBD - 预期交易的frequency /recency 热力图
      • 2.1.3 顾客留存概率热力图
      • 2.1.4 评估模型效果方式一:模型验证重复购买频率
      • 2.1.5 模型训练
      • 2.1.6 预测结果
      • 2.1.7 客户交易预测
      • 2.1.8 客户概率历史
      • 2.1.9 gamma-gamma模型估算客户终生价值
      • 2.1.10 模型相关性
      • 2.1.10 gamma-gamma模型训练
      • 2.1.11 使用DCF method计算CLV
    • 2.2 BG-NBD模型用于客群分析
      • 2.2.1 数据载入
      • 2.2.2 [宏观] 流失率p- beta分布求解
      • 2.2.3 [宏观] 整体用户预测销量
      • 2.2.4 [微观] 每个用户交易次数的条件预测
  • 3 Lifetimes package的介绍
    • 3.1 函数:summary_data_from_transaction_data
    • 3.2 标准建模数据样式
    • 参考文献

目前该系列的几篇:

用户增长——CLV用户生命周期价值CLTV 笔记(一)

用户增长 - BG/NBD概率模型预测用户生命周期LTV(二)

用户增长——Cohort Analysis 留存分析(三)

1 理论

1.1 BG / NBD概率模型介绍

数据运营36计(六):BG/NBD概率模型预测用户生命周期LTV,Python实现

用户存续期价值评估(CLV) 一

想象你有一批客户,可能会重复购买,有些频繁一些而有些不太频繁。对于预测CLV来说,你希望知道哪些客户是活跃的,会继续从你这里购买产品;每个客户会购买多少? ​ 为这些问题建模看似简单实则非常困难。 比如说,一个客户以前每天都在你这里购物,但有一个星期没有购物了,这很可能表示这个客户已经流失了;而另一个客户每月购买一次,在同样情况下就不会被认为是流失了。也就是说,流失率和购物频率是非常相关的。 其难点在于,我们很难观测到任意客户的流失瞬间,只能对其进行概率建模。

要预测由客户带来的收入,一般会把与客户的业务模型分为有合同的和无合同的、连续的和离散的。

本篇讨论应用最为广泛的适用于 无合同连续业务模型 的概率模型:

  • Pareto/NBD (negative binomial distribution) 模型
  • 其增强版本BG(Beta Geometric)/NBD模型 - 非契约客户关系情境下重复购买行为(需要购买次数 > 1)

这里注意:

  • 有合同与无合同(或者有合约 / 无合约),比如,合约在国内最有代表的是合约手机。一般互联网产品,合约形态较为少见。CLV 的产品形态要求非合约。

BG/NBD模型又称为贝塔几何/负二项模型,BG/NBD 是一个经典模型改进型,详细的数学论证参见:A Note on Deriving the Pareto/NBD Model and Related Expressions

BG/NBD模型是用于描述非契约客户关系情境下重复购买行为。

即用户可以随时购买产品,无时间约束。该模型可利用用户历史交易数据(RFM)来预测未来每个用户的交易次数和流失率。

该模型的几个假设前提:

(1)【交易假设】用户在活跃状态下,一个用户在时间段t内完成的交易数量服从均值为λt的泊松分布。

在一年中的每个月,客户都以抛硬币的方式来决定是否购买。我们所观察到的购买次数取决与泊松分布的参数

0 人点赞