Scikit-learn
Scikit-learn是基于Scipy为机器学习建造的的一个Python模块,他的特色就是多样化的分类,回归和聚类的算法包括支持向量机,逻辑回归,朴素贝叶斯分类器,随机森林,Gradient Boosting,聚类算法和DBSCAN。该项目由David Cournapeau建立于2007年。起初作为谷歌暑期项目,从那时起,许多志愿者都作出了贡献。scikit-learn之前被称作scikits.learn。
重要链接
- 项目源代码地址:https://github.com/scikit-learn/scikit-learn
- HTML文档(稳定版):http://scikit-learn.org
- HTML文档(开发版):http://scikit-learn.org/dev/
- 文件下载地址:http://sourceforge.net/projects/scikit-learn/files/
- 问题跟踪:https://github.com/scikit-learn/scikit-learn/issues
- 邮件列表:https://lists.sourceforge.net/lists/listinfo/scikit-learn-general
- IRC频道:#scikit-learn at http://irc.freenode.net
依赖包
- scikit-learn支持Python2.6、Python2.7和Python2.5、Python3.4、Python3.3
- 编译软件所需要的依赖包是NumPy >= 1.6.1, SciPy >= 0.9,C/C 编译器,在生产环境中需要安装Cython >=0.23,运行示例需要还安装Matplotlib >= 1.1.1,运行测试版本还需要安装nose >= 1.1.2。
- scikit-learn同时使用CBLAS,一个基本线性代数子程序库的C接口。
安装
- 默认安装再home文件夹根目录
python setup.py install --user
- 在Unix/Linux系统为所有用户使用
python setup.py build
sudo python setup.py install
贡献代码
- 您可以使用以下命令查看最新的来源:
git clone https://github.com/scikit-learn/scikit-learn.git
- 关于如何设置环境的快速教程: https://github.com/scikit-learn/scikit-learn/blob/master/CONTRIBUTING.md
- 在开始之前,请查看文档以确保您的代码符合指南要求: http://scikit-learn.org/stable/developers/index.html
测试
- 安装完成后,您可以从源代码目录外启动测试用例(你需要先安装nose)
$ nosetests -v sklearn
- 在Windows下,建议使用下面的命令(调整python.exe程序路径)因为测试用例使用multiprocessing时,nosetests.exe程序与其交互性能差:
C:Python34python.exe -c "import nose; nose.main()" -v sklearn
Github项目地址
scikit-learn:https://github.com/scikit-learn/scikit-learn