一直以来有人问:“ 数据分析 VS 数据挖掘 VS 数据科学家,它们到底有什么不同?入行大数据的话该怎么选?” 估计 90% 程序员,包括一些数据相关工作的⼩伙伴,都给不出准确回答。最近整理了这张对比长图,来回答这个问题!PS. 被问次数太多了,实属无奈
概括一下,逼格满满的数据科学家人群最少,要求和限制因素也最多。适合人群更广的数据分析和数据挖掘,这两个工种的差异如下。
从要求来讲:数据挖掘偏技术,数据分析偏业务;
从能力来讲:数据挖掘需要专精技术,数据分析要求综合素质。 下面这张图清晰展示了它们发展方向间的关系。
那么入行大数据,该选数据挖掘还是数据分析呢?(这两个职业同样为公司创造价值)最重要的一个因素是:看哪个职位与自己的性格、喜好比较匹配。如果对业务、商业模式感兴趣,强项在为人处事方面,数据分析显然是优先选择。
对于多数程序员来说,数据挖掘则是更优选。因为自身性格相对内敛,喜欢钻研技术,不太喜欢天天和业务打交道,做数据挖掘是在擅长的方面发力会更顺畅。当然,下面这些情况的人做技术向的数据挖掘更有优势:
研发部⻔谋求转型的开发⼈员; 计算机相关专业以及数统相关专业毕业⼈员; 专注于从事数据相关⼯作、谋求技能提升、岗位晋升以及跨⽅向发展的人。
从目前的市场来看,数据挖掘的薪资比数据分析高一些。原因很简单,数据挖掘工程师或算法工程师有较高技术门槛,不懂模型和编程,简历关都过不了,某些情况下还需要项目和学术背景。加上大多数互联网企业都是 “先工程后分析” 的流程,数据挖掘工程师的需求更迫切,薪资也最舍得给。
较高技术门槛,也意味着入门数据挖掘并不轻松。不仅要掌握一门编程语言,如 Python /Java、C / C ,还需要会 Hadoop,HIVE,SQL数据库操作,掌握数据挖掘和机器学习的基础知识和算法、特征工程的基础知识,了解统计学的时间序列模型,变量的相关系数,ROC和AUC曲线,交叉验证,主成分分析......想想就是个大的学习工程。