民间有一句俗语叫做:“看花容易绣花难”,画龙点睛的添花之笔就更难了,同数据分析是一个道理。
数据分析大致有三层:绣花(数据处理)、看花(数据转化)、添花(信息输出),每一个层次,对行动力、思考力、智慧力等有更上一层楼的要求。
绣花:需要我们掌握数据收集、数据处理、数据呈现等基本数据加工流程,也是我们数据开发常说的ETL流程,将数据集成,能够全面完整准确的构成分析对象的数据集。
看花:需要看花人有清晰的结构思维,以业务大局为视角,基于量化数学表达,从万花丛中:知道怎么了?为什么?怎么解?
添花:基于看花的信息归纳,能够为疑难杂症配置药方,用数据驱动业务及大战略的制定。
绣花是手段,看花是过程,目的是为了锦上添花。
一,数据绣花是一门手艺
1.数据收集
巧妇难为无米之炊,数据分析大师也不能脱离数据主观臆断,想要分析好数据必不能少,前期的数据收集非常重要,数据收集也是有章有法的。
我们可以尝试经典的“5W1H”法则也可以结合ECRS策略。
who:分析什么对象: 它是有哪些属性定义的对象。
what:收集什么数据:对象类型限定我们搜集的数据域,对象的属性决定可以收集的数据指标集。
why:为什么要收集数据:数据是论据,论据要围绕论点,收集数据是为了验证假设,找到答案。
when:收集什么时间段的数据:数据收集的时间段大致分为当期,往期;当期是为了描述问题,往期是为了对比发现问题。
where:这些数据存在哪些系统里:业务系统,日志系统,外部抓取。
how:如何才能获得这些数据:找数据源,用工具SQL,python抽取转换载入或者简单直接找人要,比如分析师会找数据开发要数据。
2,数据处理
亲近人的习惯:行转列的数据变换,符合左右阅读及水平对比的思维习惯。
多视角的探查:维度组合的聚合,提供看数据的不同视角,力求全面的发现信息点。
微处理的质变:数据的过滤排序同样也能使量的数据呈现出质的变化。
3.数据分析
基础的数据分析可粗略分为三大类:趋势、构成、对比。统称为:描述统计。
趋势:指标随时间的变动,表现为增幅(同比、环比等)。
构成:指标在不同层次上的表现,包括区域分布、客群等级分布等。
对比:常见的分析方法有AB测试等。 数据分析的“六字决”
4,数据呈现
数据呈现形式大致有三种:文字描述、规则公式表达、图表可视化。其中图片可视化让提升看数效率,更具有说服力。数据呈现的基本常见要求如下:
工具:excel、D3、echartjs、R、Seaborn 这样的工具很多;
形式:图文并茂的基本原则通俗易懂,活灵活现、有趣味有升华;
原则:领导层要读图表、看规律、要结果,执行层要看数据、读文字、看过程。
二,看花也不容易
工具固然重要,工具能让数据分析的过程更加高效,但使用工具的底层逻辑更重要。如果没有相应的思维方法, 即使你的工具掌握得很专业,也解决不了工作当中的问题,就更别提创造价值了。
数据分析思维共包含三种底层的思维模式:分别是结构思维、业务思维和数学思维。
1. 结构思维
需要运用《金字塔原理》一书中思维结构化思维,演绎归纳,层层递进的表达:我们呈现的东西一定要遵循MECE原则:不重、不剩、不漏 。
纵向关系:上一层的思想必须是下一层思想的概括总结或者是下一层思想的结论。自上而下,结论先行。
横向关系:演绎关系和归纳关系。
叙述方式:包括背景、冲突、疑问、回答四个要素。
2.业务思维
数据为王,业务是核心,做好数据分析,业务思维很重要,要做到:了解整个业务链的结构,清晰业务的发展规划,抓住业务的核心指标,数据分析一定要有的放矢服务业务,对业务有助益。
3.数学思维
在结构化的基础上,业务系统链条之上的数据往往会存在一些数学关系及逻辑关系,使其能进行+、-、×、÷的计算,将这些论点进行量化分析,从而验证论点。所谓指标体系,就是这么梳理得来的,数学表达式串联其中,形成一个有机体。
比如:经济学公式:需求弹性公式、边际效用公式、总效应=替代效应 收入效应、AD-AS模型、短期及长期生产函数、IS- LM模型、乘数效应等等。物理学公式:抛砖一下
三、添花难能可贵
当你能够以业务发展为核心,结构化的拆解业务关键指标的时候,你就达到了认知层,接下来就到了最重要的添花层,这个层次需要多学多练,日子久了就自然而然了,强求不来,诸君好运,早日破功。