截止2021年01月30日,《大数据成神之路》第一个版本更新完毕。
Github地址:https://github.com/wangzhiwubigdata/God-Of-BigData
截止目前为止收获3500 Star,1200 Fork。这个仓库建立的初衷的是小编个人学习和面试过程中的一个笔记本,最初的时候简单到只有几个txt,在某一天突然收获了10几个Star,并且有一个妹子居然给我提了一个PR。所以才下定决心把它完善起来。
在更新中期因为生病耽误了很长时间,大多数时间都是荒废状态,中间也不断有新的读者过来加我好友问我原因。
后来身体恢复后继续更新,真正更新时间也就2个月左右,主要利用一些周末业余时间进行。
这期间不断收到读者的打赏和感谢,倍感欣慰。
该怎么利用这个Repo
与读书的时候学习方式不同,小编认为工作后的技能掌握都必须带有强烈的目的性。
每当遇到一个新的技术点,无非就是去官网看一下Quick Start,了解一下原理,然后就迅速投入实战,然后在实战中不断熟悉。软件工程是一门实践学科,看是看不会的。
数据方向的学习路径可以参照里面目录学习即可,从基础、进阶、框架、实战、面试(部分面试题只在星球更新,后台回复"知识星球")层层递进。
小编曾经不止一次的强调,单纯的数据方向天然低代码,平台化严重。扎实的后端基础、深厚的业务数据架构设计能力和基本的机器学习算法是大家未来职业生涯更上一层楼的保障。
未来的数据领域是不需要一个只会用几个框架,写一写 SQL 的开发者的。会几个框架,调调API,写写 SQL 搞个什么这个平台那个仓库是个人都会,你的竞争力在哪里?
这个Repo中的东西建议大家短平快迅速掌握。然后根据工作需要去深挖一个方向,比如你在做数据平台的异构数据交换,那就去看DataX源码;你在做实时数仓,那就去翻一翻Flink的源码。
扎实的后端工程能力,基于业务的数据算法结合并工程化是未来发展的方向。
未来的想法
数据方向新的技术迭出,大量框架层出不穷,但是殊途同归,为了解决某一个方向的问题。
未来这个Repo继续完善已有的内容例如Spark3.0、Flink新的特性、数据湖等,另外会重点投入到数据算法领域,OLAP、数据湖、时序数据库、图计算、IOT方向、开放搜索、对象存储等新的方向中去。
希望读者跟上脚步。你们的未来大有可为。寇可往,我亦可往!
另外,小编开始筹备新的线上一对小多私教小课班,来帮助那些刚进入这个领域或者是工作时间不长的开发者顺利度过新手村,直接进入顶级高手行列的读者。因为是限制报名的方式,欢迎加我好友随时关注朋友圈,微信:whispererrr。