「经验」我对用户增长的理解『流失预警篇』

2022-06-30 16:47:26 浏览数 (1)

预计阅读时间:10min

阅读建议:本篇为实战经验,会让你有所收获,整体篇幅较长,建议先收藏再阅读。

解决痛点:针对一款产品,如何预警用户是否可能会流失?以及可以采用哪些手段加以干预?

00

序言

用户生命周期,可以划分为六个阶段:潜客期、新用户期、成长期、成熟期、衰退期、流失期,在之前的文章中,小火龙和大家分享了「潜客期」以及「新用户期」数据分析涉及的内容,感兴趣的同学可以戳蓝字部分。

本篇会和大家分享,当用户出现流失迹象时,如何预警并加以干预,小火龙在之前的工作中,花了不少时间在这个项目的研究上,分享一些经验给大家。

01

项目背景

在开始正文之前,先和大家分享一组数据:

根据美国贝恩公司的调查,在商业社会中5%的客户留存率增长意味着公司利润30%的增长,而把产品卖给老客户的概率是新客户的3倍。

当前,互联网公司已经过了用户增长最佳的红利期,增长成本在逐步提升,从目前下跌的股票,也可窥探一二。因此对于产品,服务好存量用户,避免流失,收益将远高于开发同等量级的新用户。由此可见,对于流失用户的召回,将成为决定产品胜败的关键。

不知是否有同学会问:“是否可以不做预警,等到用户真正流失之后再做召回?

答案:可以的,但是召回效果不理想,且成本较高。原因有以下两点:

其一:当用户对产品产生不满而离开,此时通过短信、Push等手段对用户进行召回,用户是非常抵触的。

其二:用户在离开的时候,很可能已经将APP卸载,部分召回手段是无法触达到用户的。

由此可见,当用户已经离开了产品,再想通过各种手段挽回,难度是非常大的。所以,要在用户即将流失前,根据用户的行为特征及属性特征,有效的识别出用户的流失风险,配合多元化召回策略,最大化的留住这批用户。

下面,小火龙将和大家分享一套相对通用的流失预警流程。

02

流失预警框架

流失预警流程可以划分为四个步骤,分别为流失预警、策略召回、AB实验、评估沉淀,形成一个闭环体系。

步骤一:流失预警。流失预警是所有步骤的起始,根据用户的行为特征及属性特征,预测用户在未来一段时间内是否流失以及流失可能性的大小,树模型以及Wide&Deep模型均是比较常用的,将所得到的用户标识、label、置信度输出给下游业务方。

步骤二:召回策略。业务方根据预测的数据,合理匹配「用户」、「触达方式」、「触达内容」,不同产品、不同业务场景的匹配方案均不相同,而探索最优匹配方案,往往是根据尝试获取的。原则只有一个:以最小的成本召回最多的用户。具体干预体系,会在后面和大家分享,先附上小火龙绘制的简易思路图。

步骤三:AB实验。在进行策略召回时,效果是业务方最关心的问题。而AB实验是最直接的评估方式,将一部分随机用户作为基线桶不采取任何策略,另一部分随机用户通过策略进行召回,为了保证用户群体的一致性,可配合DID(双重拆分法),将「用户差异」、「时间差异」、「策略因素」有效剥离,从而得到策略的效果。该步的目的,是度量不同策略的优劣,连同步骤二的召回形成闭环,持续优化「用户」、「触达方式」、「触达内容」的匹配。

步骤四:评估沉淀。对以上每个环节的内容进行优化,沉淀总结经验,在有条件的情况下,落盘至平台,提升后续预警召回的准确率及效率。

以上就是用户流失预警的核心流程,虽然不同产品可能会有一些细节上的差异,但万变不离其宗。分享一个小火龙总结的全景图:

下面会针对预警模型环节进行展开,谈谈注意事项,以及需要避开的一些坑。

03

数据探索环节

在模型搭建前,还需要明确两个问题,是决定模型结果是否可用的关键:

问题一:如何定义用户流失?

如何定义用户流失,这个问题是至关重要的,不同的定义方式会直接影响预测的真实性及准确性。在定义前,需要充分了解业务,与业务方进行讨论,因为不同产品对于流失用户的衡量方式是不同的,不存在通用的定义。这里需要明确两点,「流失行为定义」以及「流失时间窗口定义」。

流失行为定义

不同产品、不同场景,流失的行为定义均是不同的,关键在于做预警的目的是为了什么。

举个例子

不同产品

  • 对于电商型产品而言,购买可作为关键行为,用户多久没有下单,认为此用户已经流失;
  • 对于内容型产品而言,登录可作为关键行为,用户多久没有登录,认为此用户已经流失。

不同场景

  • 对于电商型产品,聚焦母婴品类用户是否流失,则关注母婴品类多久没有下单,认为此用户已经流失;
  • 对于电商型产品,聚焦汽车品类用户是否流失,则关注汽车品类多久没有下单,认为此用户已经流失。

流失时间窗口定义

用户流失预警的时间窗口主要包含:「特征选择期」、「空档期」、「预测期」,通俗来讲就是根据「用户过去多久的行为」来预测「用户未来多久流失的概率」。如下图:

1、 特征选择期:选择用户哪段时间的行为作为模型的特征。当然,不同产品的特征选择期会有不同,但核心宗旨基本一致:可度量出用户在特征上的时间趋势,一般而言,1-2个月的特征选择期较为合适。

2、 空档期:空档期指留给业务同学实施策略的buffer期,当然,并不是所有流失预警模型均需要,由业务方来决定。

以上图为例

我们选择了1月1日 至 1月31日的全量用户作为用户样本,来预测未来30日用户是否可能会流失,假设业务方每次需要7日来评估预测并制定匹配策略,也就是2月1日 至 2月7日,则该模型预测需跳过此7日,预测从2月8日 至 3月7日用户是否可能会流失,从而将中间的7日作为业务空档期。

3、 预测期:预测用户在未来时间段中是否可能会流失。预测期时间的选择,类似于信贷过程中经常使用的迁移率和滚动率的方式,此处我们可以采用N日内留存曲线,根据拐点理论(肘部法则)并结合业务特性来制定相应的预测。

例如:根据业务N日内留存曲线,从30日开始,留存率趋于平稳,则我们可以取30日作为预测期。(如下图)

这里大家要注意!预测期时间越长,流失预测的置信度越高,时效性越差;时间越短,置信度越低,时效性越好。因此需要同时兼顾准确性及时效性因素,一般而言,15-60日内相对较为合适。

问题二:用户流失原因是什么?

了解用户的真实流失原因,对于「模型设计」和「召回策略」来说都是非常重要的。

对于「模型设计」而言

可以有针对性的设计特征,从而更精准的进行预测。

举个例子

对外卖场景而言,假设某个用户离开的真实原因是由于骑手多次延迟,导致用户在线上进行投诉,且投诉之后没有得到很好的反馈。针对这个例子,我们可以衍生出来几个指标用于预测用户流失:派送次数、投诉次数、投诉解决比例等。

对于「召回策略」而言

可以有针对性的匹配召回策略。

举个例子

同样是外卖场景,假设有个用户属于“薅羊毛”类用户,离开的原因是由于平台不再发优惠券了,那当我们了解了用户的诉求之后,再次发放优惠券召回的可能性大大高于其他策略。

由此可见,了解用户流失的真实原因是至关重要的,以下为用户可能流失的内外部因素,大家可以参考(以搜索型场景为例,不同类型APP会存在差异)。

04

模型搭建环节

在对流失用户定义清晰,以及了解用户可能的流失原因后,就可以开始搭建流失预警模型了。模型搭建的核心环节大体分为两步:「特征工程」及「模型搭建」。

步骤一:特征工程

机器学习中有这样一句话,数据质量及特征决定结果的上限,而模型的选择和改进只是不断逼近这个上限。由此可见特征工程的重要性。特征工程细分下来分为以下几步:

我们将重点放在特征引入上,2-4的内容感兴趣的同学可以网上搜索,通用的概念及应用会非常多。我们以外卖场景为例,看看可以总结出哪些特征用于模型预测:

除了上面的静态特征之外,还需要关注趋势类特征:

根据以上信息,我们基本可以度量用户在过去一段时间在APP上的应用行为,当然,不同类型APP的特征会存在一些差异,核心思路:选择的特征均是对用户一段时间的刻画,并且在业务上对预测有所帮助。

步骤二:模型搭建

流失用户预测属于二分类问题,input特征,output用户是否会在未来时间段留下来(0/1)。其中,逻辑回归、SVM、树模型、深度学习等模型均可以解决此类问题,具体的代码实现方式,本篇就不再展开。这里强调两个注意事项,大家需要重点关注:

其一:用户分层预测

很多同学在做用户流失预测的时候,常常将所有的用户数据一同灌入模型,得出预测结果。但这样做往往会遇到一个问题,就是预测出来的流失用户,更偏向于低活,而高活用户预测流失召回却基本为0。所以为了避免这样的问题,可以将不同活跃度用户分别搭建模型。

那这里就引出另外一个问题,活跃度如何进行等级划分,一般而言,等级可分为高活、中活、低活、游离用户,而划分的标准则是依赖于用户过去N日应用天数进行的阈值划分,并且尽量保证划分的均衡。

举个例子

用户过去30日中,游离用户:1-2日;低活用户:3-7日;中活用户:8-20日;高活用户:21-30日。

这样划分固然没有问题,但是不够精准,例如:在过去30日内,一位用户是在最远期来过1天,另一位用户是在最近期来过1天,如果按照上述的计算方式,活跃程度是一样的,然而在流失预测中,显然后面的这位用户相对的活跃程度更高,流失的可能性也更小。

因此可以采用 天数 权重 的方式计算活跃度,例如下图,越靠近预测期,权值越高,具体的权重值可根据不同的业务而定。

其二:模型正负样本数量选择

训练中正负样本的选择,会直接影响到最终模型的准召。因此,可根据业务判断是否需要调整训练样本的配比问题。高成本的召回策略(消费券发放)更关注流失预警的准确率;高覆盖的召回策略(端内Push)更关注流失预警的召回率。

当然,除了可以调整正负样本,也可以根据预测出来的置信度进行控制,高成本召回策略只筛选置信度>90%的用户进行投放。

以上就是本期的内容分享。

0 人点赞