大家好,又见面了,我是你们的朋友全栈君。
很多人想学习大数据,但是都不清楚大数据学习应该怎么下手。大数据开发工程师简单整理了一下大数据学习路线图,希望对于学习大数据的朋友,有一定的帮助。
总的来说,如果是从零基础开始学习,总共分为八个阶段
第一阶段:HTML css
第二阶段:JAVASE学习
第三阶段:javaweb
第四阶段:企业级开发框架(JAVAEE)
学完了java部门,就要开始大数据的技术学习部分
第五阶段:初始大数据
第六阶段:大数据数据库知识点学习
第七阶段:实施数据采集处理
第八阶段:SPARK数据分析
互联网科技发展蓬勃兴起,人工智能时代来临,抓住下一个风口。为帮助那些往想互联网方向转行想学习,却因为时间不够,资源不足而放弃的人。我自己整理的一份最新的大数据进阶资料和高级开发教程,大数据学习群:868847735 欢迎进阶中和进想深入大数据的小伙伴加入。
以上就是大数据开发工程师给出的简单的大数据学习路线图,希望对于大家的学习有所帮助!
一、静态页面基础 1颗星
从技术层面来说,该阶段使用的技术代码很简单、易于学习、方便理解。从后期课程层来说,因为我们重点是大数据,但前期需要锻炼编程技术与思维。经过我们多年开发和授课的项目经理分析,满足这两点,目前市场上最好理解和掌握的技术是J2EE,但J2EE又离不开页面技术。所以第一阶段我们的重点是页面技术。采用市场上主流的HTMl CSS。
二、JavaSE JavaWeb 2颗星
称为Java基础,由浅入深的技术点、真实商业项目模块分析、多种存储方式的设计与实现。该阶段是前四个阶段最最重要的阶段,因为后面所有阶段的都要基于此阶段,也是学习大数据紧密度最高的阶段。本阶段将第一次接触团队开发、产出具有前后台(第一阶段技术 第二阶段的技术综合应用)的真实项目。
三、 前端框架 3颗星
前两个阶段的基础上化静为动,可以实现让我们网页内容更加的丰富,当然如果从市场人员层面来说,有专业的前端设计人员,我们设计本阶段的目标在于前端的技术可以更直观的锻炼人的思维和设计能力。同时我们也将第二阶段的高级特性融入到本阶段。使学习者更上一层楼。
四、企业及开发框架 4颗星
从J2EE开发工程师的任职要求来说,该阶段所用到的技术是必须掌握,而我们所授的课程是高于市场(市场上主流三大框架,我们进行七大框架技术传授)、而且有真实的商业项目驱动需求文档、概要设计、详细设计、源码测试、部署、安装手册等都会进行讲解。
五、初识大数据 3颗星
描述如下:
该阶段设计是为了让新人能够对大数据有一个相对的大概念怎么相对呢?在前置课程JAVA的学习过后能够理解程序在单机的电脑上是如何运行的。现在,大数据呢?大数据是将程序运行在大规模机器的集群中处理。大数据当然是要处理数据,所以同样,数据的存储从单机存储变为多机器大规模的集群存储。(你问我什么是集群?好,我有一大锅饭,我一个人可以吃完,但是要很久,现在我叫大家一起吃。一个人的时候叫人,人多了呢? 是不是叫人群啊!)
那么大数据可以初略的分为: 大数据存储和大数据处理
所以在这个阶段中呢,我们课程设计了大数据的标准:HADOOP
大数据的运行呢并不是在咋们经常使用的WINDOWS 7或者W10上面,而是
现在使用最广泛的系统:LINUX。
六、大数据数据库 4颗星
描述如下:
该阶段设计是为了让大家在理解大数据如何处理大规模的数据的同时。简化咋们的编写程序时间,同时提高读取速度。
怎么简化呢?在第一阶段中,如果需要进行复杂的业务关联与数据挖掘,自行编写MR程序是非常繁杂的。所以在这一阶段中我们引入了HIVE,大数据中的数据仓库。这里有一个关键字,数据仓库。我知道你要问我,所以我先说,数据仓库呢用
来做数据挖掘分析的,通常是一个超大的数据中心,存储这些数据的呢,一般ORACLE,DB2,等大型数据库,这些数据库通常用作实时的在线业务。
总之,要基于数据仓库分析数据呢速度是相对较慢的。但是方便在于只要熟悉SQL,学习起来相对简单,而HIVE呢就是这样一种工具,基于大数据的SQL查询工具
呐,这一阶段呢还包括HBASE,它为大数据里面的数据库。
纳闷了,不是学了一种叫做HIVE的数据“仓库”了么?HIVE是基于MR的所以
查询起来相当慢,HBASE呢基于大数据可以做到实时的数据查询。一个主分析,
另一个主查询
七、实时数据采集 4颗星
描述如下:
前面的阶段数据来源是基于已经存在的大规模数据集来做的,数据处理与分析过后
的结果是存在一定延时的,通常处理的数据为前一天的数据。
举例场景:网站防盗链,客户账户异常,实时征信,遇到这些场景基于前一天的数
据分析出来过后呢?是否太晚了。所以在本阶段中我们引入了实时的数据采集与分
析。主要包括了:FLUME实时数据采集,采集的来源支持非常广泛,KAFKA数据
数据接收与发送,STORM实时数据处理,数据处理秒级别
八、spark数据分析 5颗星
描述如下:
同样先说前面的阶段,主要是第一阶段。HADOOP呢在分析速度上基于MR的大规模数据集相对来说还是挺慢的,包括机器学习,人工智能等。而且不适合做迭代计算。SPARK呢在分析上是作为MR的替代产品,怎么替代呢? 先说他们的运行机制,HADOOP基于磁盘存储分析,而SPARK基于内存分析。我这么说你可能不懂,再形象一点,就像你要坐火车从北京到上海,MR就是绿皮火车,而SPARK是高铁或者磁悬浮。而SPARK呢是基于SCALA语言开发的,当然对SCALA支持最好,所以课程中先学习SCALA开发语言。什么?又要学另外一种开发语言?不不不!!!我只说一句话:SCALA是基于JAVA做的。
比如从历史数据的存储,分析(HADOOP,HIVE,HBASE),到实时的数据存储(FLUME,KAFKA),分析(STORM,SPARK),这些在真实的项目中都是相互依赖存在的。
发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/141975.html原文链接:https://javaforall.cn