“表”解机器学习

导语：在过去的几个月里，作者一直在专注于整理归纳AI的各类小要点。在被越来越多的朋友同事问及时，我决定将这些总结和心得的完整版分享给大家。为了增加内容的趣味性和可读性，我也在每个主题下面加了些注解，希望对你们有用。
另外，小编在这里邀请大家加入到我们，小编Tom邀请你一起搞事情！

神经网络

各种公式~

机器学习

概览

Scikit-learn 算法

这张图可以帮助你找到正确的估计器，这应该是机器学习汇总最难的部分。下面的流程图可以帮助快速查找文档，并对每种估计器做了大致的介绍，有助你更快了解问题并找到解决方案。

Scikit-learn(学名scikits.learn)是一个免费的机器学习Python编程语言库。包括了各类分类、回归与聚类算法，并支持向量机、随机森林、梯度提升、 K-means和DBSCAN。它还可以与Python NumPy和SciPy进行交互。

Microsoft Azure 算法

这个微软Azure的机器学习表可以帮助你为预测分析方案选择合适的机器学习算法。首先根据数据的性质，匹配最佳算法。

用于数据科学的Python

TensorFlow

今年5月，Google宣布在第二代TPU和Google计算引擎中加入对TPU的支持。第二代TPU拥有高达180 teraflops的性能。当 64个TPU组合在一起时，可以提供高达11.5千万亿次的浮点运算性能。

Keras

今年，Google也在TensorFlow的核心库中支持Keras。Chollet认为比起端到端的机器学习框架，Keras更应作为一个接口。它提供的是更高级别、更直观的抽象集，使得无论后端科学计算库是什么，都可以轻松地配置神经网络。

Numpy

NumPy 是针对Python中的一个非优化的字节码解释器——CPython的参考实现。针对这一版本的Python编写数学算法的运行速度相对较慢的问题，Numpy 使用的是多维数组和函数与运算符来改写部分代码，从而提高运行的效率。

Pandas

“Pandas”的名字源于“Panel Data”，是多维结构化数据集的计量经济学术语。

数据预处理

数据预处理（data wrangler）一词已经开始渗透进了流行文化中。今年的电影“金刚·”中，演员Marc Evan Jackson饰演的角色Steve Woodward正是被介绍为——我们的数据处理者。

用 Dplyr 与 Tidyr 进行数据预处理

SciPy

SciPy 是基于NumPy数组对象构建的，是NumPy堆栈的一部分，包括 Matplotlib，pandas和SymPy 等工具，以及扩展的科学计算库集。该NumPy 堆栈与其他应用程序（比如MATLAB，GNU Octave 和 Scilab）用户差不多。NumPy堆栈有时也被称为SciPy堆栈。

Matplotlib

Matplotlib是Python编程语言及其数学数学扩展NumPy的绘图库，提供了面向对象的API，用于使用 Tkinter、wxPython、Qt或GTK 等通用GUI工具包将图形嵌入到应用程序中。还有一个基于状态机（如OpenGL）的程序 “pylab”接口，很像MATLAB，但不鼓励使用。

Pyplot 是matplotlib的一个模块，提供了一个类似MATLAB的界面。Pyplot 跟MATLAB一样容易上手，兼容Pyhton还是免费的~

数据可视化

PySpark

机器学习人工智能神经网络 scikit-learn 编程算法

0 人点赞