双重差分模型

2019-09-02 21:55:04 浏览数 (2)

今天给大家介绍一种比较常用分析方法。叫做双重差分法。啥叫个双重差分法呢?我们先不管这个什么法,我们直接来看例子。

假如现在市场同学做了一场促销活动,然后让你评估一下这场活动的效果怎么样,假设你们事先已经明确了活动的目标就是提高销量。那要看活动效果怎么样,其实就是看一下活动前后的销量有没有变化。通过对比活动前后的数据,你发现活动前后销量增加了10%,可是你能说明这10%全是活动带来的吗?很显然不太能。

为什么不能呢?是因为如果没有活动,不同时间段的销量本来就会发生变化。知道了原因了,现在我们需要去排除原因。那怎么排除呢?我们可以找一部分与活动区域相似的区域(注意,这里要相似的区域),然后给这些区域不上活动,看不上活动的区域,在两个时间段内销量的变化情况。如果你现在通过数据发现,不上活动的区域在两段时间内销量变化了4%。

通过上活动与不上活动两部分区域在两段时间内的比较,我们就可以得出活动带来的效果是: 总增量-自然增量=10%-4%=6%。

我们把前面只对活动前后的数据比较叫做一重差分法。对上活动区域前后效果与不上活动区域前后效果的比较称为双重差分,简称DID(difference in difference)。

再次强调一下,用双重拆分法有一个很强的假设条件,就是上活动区域与不上活动区域如果在没有活动的情况下,两部分区域的变化趋势应该是一样的。

有的时候可能因为各种原因的限制,没办法找一部分相似的城市去做对照,这个时候怎么办呢,可以找类似时间段内没有活动时的销量增长幅度来和有活动以后的增长活动做对比。

这个分析模型的核心,其实就是告诉我们,影响数据变化的因素有很多,我们不能单纯地只看一个总包的效果,要尽可能的去拆分到具体每一种的影响效果是如何的。只有这样才能更加精准的定位到问题。

0 人点赞