文章期号:20190526
数据能力三章经,第一章统计入门
浩瀚的宇宙,无垠的时空,短暂的人类史,虽然渺小但成就却是伟大的,我们从匍匐到直立,聚沙成塔,抵御凶禽猛兽,顺天改命,成就了一个人类登顶的地球生态,编织了一个宏伟的社会蓝图。
在这个“物竞天择,适者生存”大环境之下,我们凭什么被选择?又拿什么去适应呢?
今天我想从统计学的角度,尝试回答这个问题,那就离不开数据了:
从简单几个数字符号的加减,直立人学会了分工与协作;文字的出现,处理的数据变得多元,开始制定简单的规则形成部落族群;每一次种族融会,文化冲突 都是在升级人类共同体处理更多复杂不一数据的能力,这种能力是进化的重要组成,数据本身就是人类最直接的进化的记录史。
从简单的石头,树枝到壁画,纸张,再到今天的硬盘,计算机。我们存储的数据量成指数级上升,这是存储数据能力的升级;
从简单的计数加减到平均数,中位数描述,再到概率分布,机器学习。我们能在更多数据中更快的发现的信息,这是数据转化为信息能力的升级。
从太极,八卦 到 24节气,再到知识图谱,人工智能,在信息中提炼出普适的价值判断来完善知识体系,这是完善知识能力的升级。
当我们在不断变化的环境中,顺应百变,随机应变的运用已有的知识去解决问题,这就是智慧的能力突破。
统计学是围绕数据主体的一门学科,它是现在人工智能的基础,我们能够借助统计学知识,从海量的数据层层抽取,不断抽象和发现数据背后的价值规律。发现普适于大多数人的行为选择,符合大多数人的价值判断,就是数据背后的最大价值。
数据时代到了,拥有处理数据,分析数据的能力越来越重要;今天借此整理自己一年多来学习统计学的历程,希望你能少走弯路,在学习数据分析的路上走的更快。
我的学习轨迹(基于R语言统计学习):
- 数据的简单描述,假设检验相关知识点,
- 数据的可视化,常用图表制作,可参考文章:《R语言,制作常用图表》
- 分布是检验数据的基础,随机变量的概率分布,
- 参数估计的学习,后续将会新增相关文章
- 类别变量分析,可参考文章:《类别变量分析》
- 方差分析,可参考文章:《方差分析:单因子和双因子分析》
- 预测模型:一元线性回归,可参考文章:《一元线性回归模型的销售预测》
- 预测模型:多元回归模型,
如果你耐心的学完上述文章,恭喜你统计学入门了,下一步我们一起学习,多元统计和机器学习吧。