数据挖掘更在乎成本与收益

2019-07-15 17:26:05 浏览数 (1)

统计分析一般都是验证性分析

数据分析中,不管是数据挖掘领域还是统计分析领域,都较为侧重验证性,验证性分析占据非常重要的主导地位。不同的是,99%的统计分析都是验证性分析,而数据挖掘领域中验证性分析的比例略低,能达到80%-90%左右。

实际业务中用什么去主导分析?

实际工作中,当面临一个庞大的数据库时,用什么方法去主导自己的分析呢?如果仅仅针对业务痛点进行分析,这样的思路没错,但是很快会发现,这样会导致整个分析进入死胡同,并且一段时间后,大部分的数据分析工作都在做重复的分析内容,因此对商业的支撑便会出问题。此时需要反思数据分析是否有框架的指导,如果有框架的指导,还需要结合4P理论、4C理论以及客户关系理论等。

如果不了解验证分析背后框架或理论,则可以参考同行业中的相似框架。

数据挖掘不强调精度

不同的数据分析领域量化的方式不同传统分析中更为关注精确性,如果指标做不到精确,则业务人员会对模型的分析结果产生质疑,尤其是问卷行业,对精度的要求更高

然而,数据挖掘领域,精度似乎没有那么重要,我更加关注指标的可解释性以及模型与业务之间的契合性

不同场景下数据挖掘的含义不同

计算机模型、统计模型与数据挖掘模型处理问题的出发点完全不同,例如什么是大数据这个问题,不同场景下的含义是不同的:

  • 实验室场景中,由于场景样本量较小,样本获取不易,因此对数据精确度要求较高,30个左右样本量即为大数据。;
  • 市场分析中,样本量200左右即为大数据;
  • 数据挖掘领域中,通常以100万为界进行大数据的区分。

因此,提到大数据时首先要清楚场景,否则很难将数据精确度、数据以及商业价值更好的契合起来。

数据挖掘不太关心因果

通常,统计分析侧重于模型的因果,然而,商业价值中,因果关系并不是那么重要,探究结果只会带来成本的上升,因此数据挖掘模型不太关注因果,数据挖掘领域更为关注成本与收益

0 人点赞