基础
1.第一个是Excel。这看起来很简单,但实际上并非如此。Excel不仅可以执行简单的二维表,复杂的嵌套表,还可以创建折线图,柱形图,条形图,面积图,饼图,雷达图,组合图和散点图。
2.在SQL Server或Oracle上掌握SQL语句。虽然您是业务分析师,但如果您可以依赖IT和IT工具(例如多维BI分析模型),有时您无法获得所需的数据。学习 编写嵌套的SQL语句,包括 join,group by,order by,distinct,sum,count,average和各种统计函数,这非常有帮助。
3.掌握可视化工具,例如BI,例如Cognos,Tableau和FineBI等,特别关注企业使用的工具,就像我以前使用FineBI一样。使用这些工具进行可视化非常方便,特别是如果分析报告可以包含这些图像。这些技能肯定会吸引高层领导的注意力,因为它可以使他们一目了然,并深入了解业务的本质。此外,作为专业分析师,使用多维分析模型Cube,您可以轻松高效地自定义报告。
总结:此时,如果您掌握了上述80%的技能,您可以被视为合格的分析师。此阶段的数据分析师需要知道如何使用工具处理数据,了解业务场景,分析和解决基本问题。重要的是要强调数据分析师最重要的事情是熟悉我们的业务。了解业务,分析师的逻辑将是清晰和一般的,它将排除大多数无用的分析。很长一段时间,对于我理解的业务,我在比较数据时就知道了这个问题。
在此之后,如果您想深入研究技术,您可以继续在数据科学家的指导下发展您的职业生涯。
高级技能
1.学习统计系统
- 纯机器学习强调算法的预测能力和实现,但统计学一直强调“可解释性”。例如,我可以看到两只股票之间的相关性是否相关。假设一个反相关的股票下跌,那么,根据数据,我们可以假设其他股票会上涨。
- 与数据挖掘相关的统计方法(多变量逻辑回归分析,非线性回归分析,判别分析等)。
- 定量方法(时间轴分析,概率模型,优化)。
- 决策分析(多用途决策分析,决策树,影响图,敏感性分析)。
- 建立竞争优势分析(通过项目和成功案例学习基本分析概念)。
- 数据库输入(数据模型,数据库设计)。
- 预测分析(时间轴分析,主成分分析,非参数回归,统计过程控制)。
- 数据管理(ETL(提取,转换,加载),数据治理,管理责任,元数据)。
- 优化和启发式(整数规划,非线性规划,局部探索,超灵感(模拟退火,遗传算法))。
- 大数据分析(学习非结构化数据概念,MapReduce技术,大数据分析方法)。
- 数据挖掘(聚类(k-means方法,分割方法),关联规则,因子分析,生存时间分析)。
- 风险分析与运行分析的计算机模拟。
- 软件级分析(组织级别的分析主题,IT和业务用户,变更管理,数据主题,演示和通信。
2. 掌握AI机器学习算法并使用Python / R等工具对其进行建模
传统的BI分析可以回答过去发生的事情,现在正在发生,未来会发生什么?我们必须依靠算法。虽然像Tableau和FineBI这样的自助服务BI具有内置的分析模型部分,但分析人员需要更全面,更深入的探索,需要Python和R等数据挖掘工具。此外,大数据集之间的隐藏关系无法实现通过手动分析或使用传统工具。此时,算法已实现,并且不会有任何意外。
其中,用于统计分析的开源编程语言及其操作环境R,引起了很多关注。R的优势不仅在于它包含丰富的统计分析库,而且还具有高质量的图表生成功能,可以显示结果并可以使用简单的命令运行。此外,它还有一个名为CRAN(Comprehensive R Archive Network)的包扩展机制,可以通过导入扩展包来导入标准状态下不支持的功能和数据集。虽然R语言很强大,但学习曲线很陡峭。就个人而言,我建议你从Python开始,它拥有丰富的统计库,如NumPy,SciPy,Python数据分析库和Matplotlib。
数据人才的最终发展围绕着数据战略。例如,数据战略专家可以使用IT知识和经验来制定业务决策。数据科学家可以使用IT技术开发复杂的模型和算法。分析顾问可以结合实际的业务知识和分析经验,专注于您的行业的下一个爆炸点。
因此,您需要具备沟通,组织,管理技能和商业思维。这不限于某个位置。您需要在更高的位置思考并为公司寻求利益。与此同时,我们还必须考虑如何使用“数据分析”卡在公司中发挥作用并使用数据来推动业务运营。这是值得思考的问题。
课程和书籍推荐
首先学习基本概率。一个很好的资源是概率和统计学概论。
快速了解统计学习中使用的术语,是做什么的。为此,请阅读: Wasserman, Larry. All of statistics: a concise course in statistical inference. Springer, 2004.
为了学习基本的统计思想,统计学习简介是一本流行的教科书。
使用d3.js可视化库,使用基本HTML和JavaScript学习基本可视化。
学习基本算法和算法分析,并了解如何分析算法复杂性。平均复杂性,最差复杂性。每次编写程序时,都会预计所需的时间(通过算法分析预测)。 我在Coursera.org上推荐普林斯顿的算法类
通常,伟大的数据科学家都有博客供所有人访问。我推荐这些博客,我经常读到:
- Betaworks首席数据科学家,Gilad Lotan的博客。
- 希拉里·梅森(Hilary Mason)是纽约地区着名和着名数据科学家的首席科学家,他有一个很棒的博客: hilarymason.com
原文标题《The Skills That Data Analysts Need to Master》
作者:Vincent Wong
译者:February
不代表云加社区观点,更多详情请查看原文链接