在我们的实际工作场景中,可以通过“数据分析”对大量业务数据的观察、分析,得到一定的规律/趋势等情况,能客观地反映出当前业务线存在的一些问题,还能为决策者提供数据支持等,尤其在数字化时代,面对海量的数据,就需要一些数据分析工具和方法快速有效的处理那些数据,分析数据,产出有效地落地方案。在未来,“数据分析”将在各行各业的作用越来越显著,突出,必要。
对于数据分析,还是有很多职场人都有这样一些困惑:
- 不知道从哪里获取数据;
- 不知道数据分析的学习路径;
- 不知道有什么样的工具;
- 不清楚分析的方法论和框架;
- 大部分的数据分析流于形式;
- ……
其实,数据分析并没有大家想象的那么难!接触了很多数据从业者,根据自己的思考,梳理了【数据分析学习路径1.0】,其中肯定有不足之处,来补充一下【数据分析学习路径2.0版】,搭建数据分析体系~后续将不断地,持续地完善更新补充,希望对有志于学习数据分析的同学有所帮助。
一、数据、数据指标、数据分析的概念
其实大家一直都在接触数据、数据指标、数据分析,但是对于三者具体的定义又很难说清楚。那么,先从下面5个选项哪些属于“数据”概念的范围开始梳理。
大部分人都会首要选择“4.报表”,但是很难有人会认为上面5个选项都是。就这反映了一个很普遍的现象:很多人都会先入为主,认为数据就是各种表格、各种数字,例如excel报表、各种数据库。这就是一个认识的偏差,它会使得我们对数据的认识变得很狭隘。
(一)什么是数据
数据(data)是描述事物的符号记录,是构成信息或者知识的原始材料。这种哲学层次的定义,让数据的范围极大丰富,也符合目前“大数据”发展的需要。试想一下,现在很多搜索引擎做的 “图片识别”、“音频识别” 难道不是数据分析的一部分吗?
作为一名互联网数据运营从业者,我们接触到的数据可能没有那么复杂,但是也有很多类别。
从数据的来源来看,可以分为企业外部数据和内部数据。外部数据主要包括社会人口、宏观经济、新闻舆情和市场调研数据;内部数据包括用户行为数据、服务端日志数据、CRM与交易数据。不同数据的获取途径、分析方法、分析目的都不经相同,不同行业、不同企业在实际分析中也都各有偏好。
那么我们常见的“信息”和“数据”有何不同?
数据是信息的载体和表现形式;信息是数据的内涵,信息加载于数据之上。以书本和知识为例,书本属于数据概念范畴,知识属于信息概念范畴;书本是知识的一种载体和表现形式,知识是书本的内涵和升华。
(二)什么是数据指标
其次,来看看“指标”是什么?指标的作用是「度量」业务,最终目的是用来衡量业务是否符合预期,并为后续业务优化工作提供思路和方向。从这个角度对它进行拆解:指标 = 维度 汇总方式 量度。还可以分为:
- 原子性指标:不可再拆分的指标:如交易额、支付金额等
- 派生性指标:原子性指标 修饰词 时间段:如日活、月活、次日留存、日转化率等
◆ 维度:回答从哪些角度去衡量的问题?
◆ 汇总方式:回答用哪些方法去衡量的问题?
◆ 量度:回答目标是什么的问题?
例如:
①订单数:统计周期内,用户完成支付的订单数量总和;
②复购率:统计周期内,重复消费用户数(消费两次以上的用户)在总消费用户数中的占比;
(三)什么是数据分析
数据分析是指从数据中提取有用的信息,并指导实践。这里有两个点需要注意:首先,我们需要提取的是有用的信息,而不是自嗨;其次,这些信息需要用来指导实践,而不是流于形式。
我理解的数据分析不是从什么高大上的角度出发,它绕不开是什么、是多少、为什么、会怎样、又如何这几个问题。
说明白点:
▶是什么(树立数据标准)
▶是多少(数据描述状况)
▶为什么(探索问题原因)
▶会怎样(预测业务走势)
▶又如何(综合判断状况)
总之,我们做好数据分析,要对数据分析的价值有清楚的定位,不能沦为单纯的 “取数”、“做表”、“写报告”,数据分析应该是对业务有实际的指导意义,并结合业务痛点去发现问题从而解决问题的工具。
二、数据分析体系搭建
1.理清业务阶段和方向
业务前期:创业期,最关注用户量,指标体系应紧密围绕用户量提升做各维度拆解,如渠道
业务中期:上升期,更加看重优化当前的用户量结构,比如看用户留存。分析产品的健康度,为产品体检
业务后期:成熟发展期,更多关注的就是产品变现能力和市场份额,要关注收入指标ROI等,各种商业化模式的的收入,同时做好市场份额和竞品的监控,以防止新起势力抢占份额等
2.确定核心指标
核心指标的选取是挑选那些引起业务变化的要素或者某种维度波动的要素。
比如某款产品的日活口径是打开APP,通过不断的买量,日活也一直在上升,然而分析时发现,打开APP的用户中,3秒跳出率高达30%,这是非常不健康的,那么当前的核心指标日活实际上已经有了问题,更加好的核心指标应该是停留时长大于3秒的用户数
3.核心指标维度拆解
监控核心指标,本质上是监控维度核心指标。通用的拆解方法都是先对核心指标进行公式计算,在按照业务路径来拆解
4.数据分析
根据数据进行分析,另外,我们应建立核心指标的相关报表,实际工作中,报表会在埋点前建好的,这样的话一旦版本上线就能立刻看到数据,而且也比较容易发现问题~
案例:
小张今年刚毕业,在某公司从事新媒体工作,负责微信的日常运营。小张并不清楚微信运营的核心目的,尝试了很多方法,原创、翻译、改写了很多文章发布在微信上,但是阅读量时高时低,总体一般。
经理让小张想办法改进一下微信运营,提高微信的粉丝数和阅读数;但是小张毫无头绪,无从下手。
这是很多运营真实的写照,琐碎的工作容易让人忘记思考,这很可能就发生在你我的身边。
我们从数据分析的角度对这个案例进行了诊断,总结了小张存在的这些问题:
- 不清楚自己需要关注哪些核心指标;
- 不清楚目标用户的特征(用户属性、用户画像等);
- 对自己过往工作缺乏系统分析(数据采集、监测和分析)。
从业务增长的角度出发,做了一套数据分析体系,配合其内容工作的开展。
第一点,理清业务,确定核心指标
运营需要明确知道自己的目标或者KPI,然后选择一个核心关键指标(OMTM)进行监测。如果是创业公司,初期可能需要拉新,那么核心指标是注册用户数或者新访问用户数。如果是资讯媒体,注重影响力和覆盖面,那么核心指标应该是微信阅读数或者网页PV。
第二点,用户画像
无论是哪一种运营岗位,都需要明确知道自己的(目标)用户是那些人?这些人都有哪些特征,他们的关注点和痛点是什么?如果你的用户是产品经理,那么可以尝试爬虫抓取产品经理网站上有关的问题,然后做文本分析:这是定量层面的分析。
同时,通过调查访问和问卷调研,获取更加深入的用户特征信息:这是从定性层面的分析。
第三点,持续监测
借助数据分析工具,对核心关键指标(OMTM)进行持续监测。对于指标异常情况,我们需要及时分析和改进。
第四点,数据分析
统计和分析过往内容的数据,找出哪些内容、哪些标题、哪些形式、哪些渠道的效果更好,然后朝这方面不断优化。
三、学习路径:业务、工具和资源
学习数据分析步骤,如下:
1、明确目标,认清自己。(对应明确问题)
很多人认为定目标、设计划是假大空,但如果没有目标,你会发现时间过去,你依然停留在原地。薪资涨幅、买房买车等,很多看似不是外界能决定的事情,都可以通过设立目标来实现。
数据分析的学习亦是如此,不同的目标方向,路径不经相同。还有清楚的了解自己,知道自己的优势是什么,现有的资源有哪些等?为什么学习数据分析?
学习数据分析主要有以下几个目的:
✔提升数据分析技能,辅助本职工作
✔转行数据分析相关岗位,零基础入门
✔数据分析从业者,技能思维进阶
2、计算差距,弥补不足。(对应分析问题)
先确定目标,计算出自己差哪里,需要做的哪些弥补不足之处,其实就是倒推为了达到目标要做的事情,所谓的倒推做事法。而不同的目标也有不同的侧重点,具体如下:
✔提升数据分析技能辅助工作
主要侧重数据思维的培养和分析思路的完善。熟知数据分析分析方法模型,理解业务,针对性的学习数据分析工具,如excel的透视表可视化 ppt技能。
✔转行数据分析相关岗位
数据分析从业路线大致可以划分成四大方向:数据分析,数据挖掘,数据产品,数据工程。针对各个数据岗位侧重的技能栈,针对性的学习补充差距~
⑴数据分析/数据运营/商业分析是业务方向的数据分析师。主要负责和支撑各部门相关的报表;建立和优化指标体系;监控数据的波动和异常,输出专题分析报告,优化和驱动业务,推动数据化运营;主要侧重数据分析工具以及业务知识的培养。
⑵数据挖掘/算法专家这是技术向的数据岗,有些归类在研发部门,有些则单独成立数据部门。主要侧重于更高的统计学能力、数理能力以及编程技巧。
⑶数据产品是具备强数据分析能力的PM,公司数据产品的规划者。负责大数据产品的设计,推荐算法的产品策略,分析和挖掘用户消费内容的行为数据,为改进算法策略提供依据,报表展示工具的落地和应用;主要侧重于各类数据模型、指标、数据挖掘和数据工程的实现,但是聚焦点是把它作为一个项目去实现,故而不用精通。
⑷数据工程师其实更偏技术,从职业道路上看,程序员走这条路更开阔。可以从数据分析师的SQL技能,往数据的底层收集、存储、计算、运维拓展。从最初的SQL,逐步侧重于了解Hadoop集群、了解presto/impala/spark、了解分布式存储……
✔数据分析从业者进阶
数据分析进阶讲具备更多的工具技能,主要侧重的是要掌握数据分析的各种工具的全栈技能,从能力增长上突破职业的天花板。一般如下:
·可视化辅助工具:excel、BI工具、python···
·统计分析:抽样推测规律、贝叶斯统计、回归、预测····
·大数据处理框架:Hadoop、storm、spark···
·数据库:SQL、MySql、DB···
·数据仓库:SSIS、SSAS····
·数据挖掘工具:Matlab、R语言、python···
·人工智能:机器学习
·挖掘算法:数据结构、一致性
·编程语言:Java、python
3、排除万难、穷尽所能的努力(对应落地方案,推动执行)
前面两步都很容易,因为动脑就够了,无需体力支持,而最后一步却是需要身体力行的去付出努力的。所以很多人完不成目标,都是因为“死”在了这一步。
但是,数据分析的学习离不开业务、工具和分析方法~如下:
(一)业务层面
数据分析并没有想象中的高不可及,掌握好相应的概念、思路、流程,运营都可以做好数据分析。这里要着重强调一点,数据分析的目的是指导业务实践;脱离实践的数据分析、为分析而分析的数据分析都是在耍流氓。
不同于职业的数据分析师和数据科学家,运营人员做好数据分析的前提是娴熟的业务理解。从业务的角度来说,数据不是数字,它是用户的心声。运营人员要从数据中发现问题,不断优化,提升用户体验、为用户创造更多的价值。
(二)工具层面
磨刀不误砍柴工,做好数据分析工具必不可少。我汇总了下面几种工具,运营可以结合自己的实际需要采用。
Excel 是最常见、最基础的数据分析工具,Excel 里面的图表、函数、透视表能满足大家基本的需求。Access 是微软 office 系列套装的一部分,是一种小型的关系数据库;当excel数据量很大、表格之间各种关联、查询、更新频繁的时候,Access就是一种非常不错的选择。
Python是一种高级的编程语言,近年来发展很快,它可以用来做数据分析、编程或爬虫;R语言是一种数据分析工具,在统计学中广泛使用。目前,Python被广泛用来编写爬虫程序,获取网上的信息,这是对运营人员非常有帮助的。
Google Analytics、观远、百度统计、友盟是常见的网站流量分析工具,Mixpanel、Heap、观远、GrowingIO属于用户行为数据分析工具,较前者功能更加丰富、分析更细致。
(三)方法层面
入门数据分析,并不需要学习多么复杂的数学知识理论,更多的是将业务操作和数据分析结合起来。在这里推荐两个网站和几本书,【数据分析·领地知识星球】希望有帮助。
- 数据分析网(http://www.afenxi.com/ ):覆盖统计理论、数据分析方法、业务分析等内容。
- 【数据分析·领地知识星球】木木自由公众号回复8进入:专注各个方面的数据分析结构化资料库,海量数据分析资料汇总(含分析方法论解析、Excel、SQL、python、tableau、统计学、业务知识、数据报告、行业报告、财务/人力/电商/商业等分析资料)
- 《谁说菜鸟不会数据分析》:数据分析入门知识汇总。
- 《精益数据分析》:从精益创业的角度,诠释业务增长的分析方法和前言案例。
- 《数据分析手记-数据分析72个问题精解》:底层认知、业务场景、能力三板斧共同铸造了完整的数据分析能力,相辅相成,而本书则是围绕着它们展开介绍。