很多同学对数据分析感兴趣,也和自己在国内做数据分析师的朋友聊过,决定未来从事数据分析方向的工作。
那么,你了解数据分析师的就业情况吗?没有经验如何入门?职业规划又是怎样的?
经验分享一
之前在电商公司做数据专员,仅限于Excel。
确定了数据分析方向后,开始在猴子老师这里系统学习,从初级的 Excel 和分析思维到中级的 sql ,后来又学习了 python 基础的部分。
边工作边学习,准备了两个项目,一个是工作中的自己做的,一个是在猴子老师这里学习到的。
开始投简历的时候,先确定了行业和公司规模,自己的意向是互联网方向的视频平台,电商,互联网金融。选择中等的公司规模,开始投递简历。
用了两周集中面试,每天平均 3 家公司,视频面试和线下面试结合。面试了几次后得出一些经验,靠谱的公司会先打电话做简短的电话沟通,再邀约视频面试或现场面试。
在面试的过程中,随着面试的次数越来越多,自己对简历中项目提到的问题也越来越熟练,查漏补缺在面试中也游刃有余。而且,sql 笔试部分猴子老师的总结的相关高频题目有问到。
入职时间不久,前期是先熟悉公司的业务,了解指标的含义。熟悉业务相关的一些报表,理解逻辑。后面会使用到一些可视化软件 tableau,python相关的应该还用不到。依然会继续深入的学下去,想要去大厂的话,对python,机器学习,abtest要有了解。
经验分享二
现在已入职一家互联网公司做业务数据分析方向的数据分析岗,分享下自己的学习和求职经历。
1、如何学习准备的
主要是分三个模块:分别是SQL、Python和业务思维拆解能力。
SQL我是偶然的机会在网页上刷到猴子老师的SQL教程,学习了一些感觉简单易懂,就算是转行也能通过详细的学习教程学会。
Python 的话因为我本身是算法转行,所以 Python 也会一些,在这我找过几个教程和案例,跟做了一遍,把 pandas 和 matplotlib 常用涉及的操作都跟做了一遍。
事实证明,我求职的业务数据分析现在 Python 应用的还不是特别多。
业务思维拆解能力,这个之前我不是特别重视,也找过其他培训机构的课程,但都没有明确讲述的。后来在名猴子数据分析初级课程之后才有了系统的了解。在业务分析中业务拆解是很重要的。
2、如何投简历和面试经历
我是在两个平台智联招聘和 boss 上投递的简历,因为自己在职找工作,基本就是每天看看打招呼的有没有自己感兴趣的岗,如果有就投一下。
因为我项目写的不是很好,九月份每周大概2-3个面试,我都是先沟通好初试视频面试的。但是在这种高频的面试下才接到两个意向公司。
其中一家工作地点太远拒绝了,另外一家有点国企风,背景调查很严格,因为之前我有合并工作经历(具体这种问题怎么处理,可以看看猴子老师的简历指导)所以也忍痛放弃了。
之后就到了10月份,依然是投了很多,但是机缘下就得到现在这家公司的面试邀约,拿下了offer。
初试技术面也是三个模块拷问的:SQL、机器学习的初级知识,另外一个简单的业务拆解,比如播放量下降如何去分析等。
3、现在刚过入职,但是这个岗还是偏业务分析一些。主要就是了解视频业务的相关知识,之后做一些专题分析。
我本身找工作的周期比较长,一年多吧,其中都是自学,找一些培训课程,我自己承受压力的能力比较弱,但是也坚持下来了,实现目标的感觉很好,所以有目标的同学一定要坚持自己的初衷呀。
经验分享三
答主@秦路
入门和职业规划应该从两个角度考虑:领域和路线。
领域是不少新人常忽略的要素,其实数据分析不会脱离业务存在。你进入哪个行业,很大程度会决定你初期的技能树和技能点。
譬如金融领域的风控模型、营销领域的生命周期、广告领域的点击率预估等,各有各的特色。
如果是一位应届生,不妨多了解自己感兴趣的领域,多积累相关的经验,为面试做准备。
如果已经有一定行业履历,只是想要转岗数据分析师,那么跨岗不跨行,尽量避免跳到一个陌生的领域。
领域经验主要也就三点:1.自己感兴趣的,2.自己擅长的,3.有钱途的。
成为某领域的数据专家,会是一个更好的筹码。
路线大致可以划分成四大方向:
数据分析,数据挖掘,数据产品,数据工程。
数据分析/数据运营/商业分析
这是业务方向的数据分析师。
绝大部分人,都是从这个岗位开始自己的数据之路,也是基数最大的岗位。
因为基数大,所以这类岗位通常鱼龙混杂。有些虽然叫数据分析师,但是每天只需要和 Excel 打交道,完成leader布置的表格整理工作就行。混个几年,成为一位数据分析主管,给下面的新人继续布置 Excel 任务。
又有一种数据分析师,岗位职责要求你掌握常用的机器学习算法,面试首先推导一个决策树或者逻辑回归。都叫数据分析师,其实天差地别。
这里更多指代互联网行业,偏业务的数据分析师,一般属于运营部门。不少公司也称数据运营或者商业分析。
这类岗位的职位描述一般是:
建立和优化指标体系;
监控数据的波动和异常,找出问题;
优化和驱动业务,推动数据化运营;
找出可增长的市场或产品优化空间;
输出专题分析报告;
实际的岗位中,不少业务端的数据分析师,主要工作都是第一点。
别管它用汇总、分析、数据支持什么修饰词,基本是跑SQL,做报表。硬生生活成了业务端的表哥。
这是很常见的情况,也是入门新人的第一个坑。因为从头到尾,这类分析师,都没有解决问题。
业务部门往往更关心,某个指标为什么下跌或者上升。产品的用户是什么样的?怎么能更好的完成自己的KPI。
以活跃指标的下跌举例:
活跃指标下跌了多少?
是属于合理的数据波动,还是突发式?
什么时候开始的下跌?
是整体的活跃用户下跌,还是部分用户?
为什么下跌?
是产品版本,还是运营失误?
怎么解决下跌的问题?
这是一套标准的解决思维。分别对应what、when、who、why、how。
每一部分都不是三言两语可以解释清楚。不要看它很简单,例如你通过多维分析,发现某个地区的活跃下跌了,不要急着把它作为分析的结论,这是不合格的数据分析。某地区的活跃下跌,只是现象,不是原因,把它作为结论提交,肯定会被骂的。
你要解决的是,为什么这个地区的活跃下跌了。是该地渠道,是该地竞争对手,是该地市场环境?这些问题都是细化的范畴。并且,它们要能以量化解释,而不是我认为。
做好了这点,才是一个真正的业务端的数据分析师。
数据挖掘/算法专家
这是技术向的数据岗,有些归类在研发部门,有些则单独成立数据部门。
数据挖掘工程师要求更高的统计学能力、数理能力以及编程技巧。
从概念上说,数据挖掘Data mining是一种方式,机器学习Machine learing是一门方法/学科。机器学习主要是有监督和无监督学习,有监督又可划分成回归和分类,它们是从过去的历史数据中学习到一个模型,模型可以针对特定问题求解。
数据挖掘的范围则大得多,即可以通过机器学习,而能借助其他算法。比如协同过滤、关联规则、PageRank等,它们是数据挖掘的经典算法,但不属于机器学习,所以在机器学习的书籍上,你是看不到的。
除此之外,还有一个领域,属于最优化问题的运筹学。现实中的问题往往有很多约束,比如护士排班.
一共有三班(早、中、晚),现在要求每班满足最低护士人数,每位护士尽量不能连班,每位护士不能连续工作5天。每位护士的夜班数要均衡,每位护士每月的班数要均衡…
这些问题很难用机器学习的方法完成,而在最优化领域,则有遗传算法、模拟退火算法、蚁群算法等。
实际的应用场景中,如外卖行业,如何寻找骑手效率最大化的最优路径,同样属于最优化,也是数据挖掘的工作范畴。
数据挖掘工程师,除了掌握算法,同样需要编程能力去实现,不论R、Python、Scala/Java,至少掌握一种。模型的实施,往往也要求Hadoop/Spark的工程实践经验,精通SQL/Hive是必须的。
常见数据挖掘项目的闭环如下:
定义问题
数据抽取
数据清洗
特征选取/特征工程
数据模型
数据验证
迭代优化
单看环节,数据挖掘对分析能力没有业务型那么高。这不代表业务不重要,尤其在特征选取方面,对业务的理解很大程度会影响特征怎么选取,进而影响模型质量。
数据挖掘的业务领域一样可以细分。金融行业的信用模型和风控模型/反欺诈模型、广告模型的点击预估模型、电商行业的推荐系统和用户画像系统。从需求提出到落地,数据挖掘工程师除了全程跟进也要熟悉业务。
因为要求高,所以数据挖掘的平均薪资高于普通的数据分析师。
数据产品经理
这个岗位比较新兴,它有两种理解,一种是具备强数据分析能力的PM,一种是公司数据产品的规划者。
前者,以数据导向优化和改进产品。在产品强势的公司,数据分析也会划归到产品部门,甚至运营也属于产品部。
这类产品经理有更多的机会接触业务,属于顺便把分析师的活也干了,一专多能的典型。
他们会运用不同的数据源,对用户的行为特征分析和挖掘,达到改进产品。最典型的场景就是AB测试。
大到页面布局、路径规划、小到按钮的颜色和样式,均可以通过数据指标评估。
俗话说,再优秀的产品经理也跑不过一半AB测试。此类数据产品经理,更多是注重数据分析能力,擅长用分析进行决策。数据是能力的一部分。
后者,是真正意义上的数据产品经理。在公司迈大迈强后,数据量与日俱增,此时会有不少数据相关的产品项目:包括大数据平台、埋点采集系统、BI、推荐系统、广告平台等。
这些当然也是产品,自然需要提炼需求、设计、规划、项目排期,乃至落地。
我们不妨看几个数据产品经理要求:
负责大数据产品的设计,输出需求文档、产品原型;
负责推荐算法的产品策略,完成相关推荐及个性化推荐产品的需求分析;
负责分析和挖掘用户消费内容的行为数据,为改进算法策略提供依据;
负责客户端数据需求的对接,制定相关埋点规范及口径,相关业务指标验证;
报表展示工具的落地和应用;
和C端注重用户体验不同,数据产品,更注重整体的分析能力和逻辑。除了产品经理最基础的Axure、Visio、MindManager等工具。
往往还需要很多技术型的能力。比如了解BI/DW原理和实施、了解常用的推荐算法、了解机器学习模型等。这也很容易理解,C端要求你了解用户需求,而在数据端,主要用户就是数据。
这当然不是说,用户体验不重要,拿推荐算法来说,除了满足用户最基本的感兴趣,也要考虑时效性,考虑新兴趣的挖掘,考虑无数据时的冷启动问题…这些一样是用户体验,只是解决方案也得从数据出发。
后端的数据产品,如报表,用户往往是你隔壁工位的小秦或小路,设计得丑一点不要紧,要是数据指标口径不统一,那才会分分钟骂街。
虽然数据 PM 需要熟悉各类数据模型、指标、数据挖掘和数据工程的实现,但是聚焦点是把它作为一个项目去实现,而不是考虑技术的细节,故而不用精通。
数据工程
数据工程其实更偏技术,从职业道路上看,程序员走这条道路更开阔。
在很多中小型的公司,一方面数据是无序的、缺失的、原始的,另外一方面各种业务报表又嗷嗷待哺。没办法,分析师只能自己撸起袖子,一个人当两个人用。兼做数据清洗 ETL BI。
数据分析踏上数据工程的不归路如下:
每天都要从五六张表上join,那么不妨加工成一张中间表;
ETL的依赖关系越来越复杂,尝试kettle/airflow等框架搞定,弄个DAG美滋滋;
运营部门的周报次次都要这几个指标,看看能否做一个自动化BI;
数据量逐日增多,最近T 1的日报需要几个小时完成,研究下查询语句的优化;
等等…
如果分析师在技术方面的灵性不错,那么技能点会往技术栈方向迁移。从最初的SQL,到了解Hadoop集群、了解presto/impala/spark、了解ELK、了解分布式存储和NoSQL……
这也是一个不错的发展方向,因为数据挖掘需要了解算法/模型,理论知识要求过高,不少硕士和博士还过来抢饭碗,如果自己不擅长容易遇到天花板。选择更底层的工程实现和架构,也是出路,薪资也不会低于数据挖掘。
部分公司会将机器学习模型的部署和实现交给数据工程团队,这要求数据工程师熟悉sparkMLlib、Mahout此类框架。
数据工程师,可以从数据分析师的SQL技能,往数据的底层收集、存储、计算、运维拓展。往后发展则是数据总监、或者数据架构师。因为数据分析出身,与纯技术栈的程序员比,思考会更全面一些,虽然技术底子的薄弱需要弥补。
另外,DBA、BI这些传统的数据库从业者,也是能按这条路线进阶,或者选择数据产品经理方向。