导语:在过去的几个月里,作者一直在专注于整理归纳AI的各类小要点。在被越来越多的朋友同事问及时,我决定将这些总结和心得的完整版分享给大家。为了增加内容的趣味性和可读性,我也在每个主题下面加了些注解,希望对你们有用。
另外,小编在这里邀请大家加入到我们,小编Tom邀请你一起搞事情!
神经网络
各种公式~
机器学习
概 览
Scikit-learn 算法
这张图可以帮助你找到正确的估计器,这应该是机器学习汇总最难的部分。下面的流程图可以帮助快速查找文档,并对每种估计器做了大致的介绍,有助你更快了解问题并找到解决方案。
Scikit-learn(学名scikits.learn)是一个免费的机器学习Python编程语言库。包括了各类分类、回归与聚类算法,并支持向量机、随机森林、梯度提升、 K-means和DBSCAN。它还可以与Python NumPy和SciPy进行交互。
Microsoft Azure 算法
这个微软Azure的机器学习表可以帮助你为预测分析方案选择合适的机器学习算法。首先根据数据的性质,匹配最佳算法。
用于数据科学的Python
TensorFlow
今年5月,Google宣布在第二代TPU和Google计算引擎中加入对TPU的支持。第二代TPU拥有高达180 teraflops的性能。当 64个TPU组合在一起时,可以提供高达11.5千万亿次的浮点运算性能。
Keras
今年,Google也在TensorFlow的核心库中支持Keras。Chollet认为比起端到端的机器学习框架,Keras更应作为一个接口。它提供的是更高级别、更直观的抽象集,使得无论后端科学计算库是什么,都可以轻松地配置神经网络。
Numpy
NumPy 是针对Python中的一个非优化的字节码解释器——CPython的参考实现。针对这一版本的Python编写数学算法的运行速度相对较慢的问题,Numpy 使用的是多维数组和函数与运算符来改写部分代码,从而提高运行的效率。
Pandas
“Pandas”的名字源于“Panel Data”,是多维结构化数据集的计量经济学术语。
数据预处理
数据预处理(data wrangler)一词已经开始渗透进了流行文化中。今年的电影“金刚·”中,演员Marc Evan Jackson饰演的角色Steve Woodward正是被介绍为——我们的数据处理者。
用 Dplyr 与 Tidyr 进行数据预处理
SciPy
SciPy 是基于NumPy数组对象构建的,是NumPy堆栈的一部分,包括 Matplotlib,pandas和SymPy 等工具,以及扩展的科学计算库集。该NumPy 堆栈与其他应用程序(比如MATLAB,GNU Octave 和 Scilab)用户差不多。NumPy堆栈有时也被称为SciPy堆栈。
Matplotlib
Matplotlib是Python编程语言及其数学数学扩展NumPy的绘图库,提供了面向对象的API,用于使用 Tkinter、wxPython、Qt或GTK 等通用GUI工具包将图形嵌入到应用程序中。还有一个基于状态机(如OpenGL)的程序 “pylab”接口,很像MATLAB,但不鼓励使用。
Pyplot 是matplotlib的一个模块,提供了一个类似MATLAB的界面。Pyplot 跟MATLAB一样容易上手,兼容Pyhton还是免费的~
数据可视化
PySpark