Github|Python开源项目漫游指南(一)

2018-01-31 12:36:34 浏览数 (1)

Scikit-learn

Scikit-learn是基于Scipy为机器学习建造的的一个Python模块,他的特色就是多样化的分类,回归和聚类的算法包括支持向量机,逻辑回归,朴素贝叶斯分类器,随机森林,Gradient Boosting,聚类算法和DBSCAN。该项目由David Cournapeau建立于2007年。起初作为谷歌暑期项目,从那时起,许多志愿者都作出了贡献。scikit-learn之前被称作scikits.learn。

重要链接

  • 项目源代码地址:https://github.com/scikit-learn/scikit-learn
  • HTML文档(稳定版):http://scikit-learn.org
  • HTML文档(开发版):http://scikit-learn.org/dev/
  • 文件下载地址:http://sourceforge.net/projects/scikit-learn/files/
  • 问题跟踪:https://github.com/scikit-learn/scikit-learn/issues
  • 邮件列表:https://lists.sourceforge.net/lists/listinfo/scikit-learn-general
  • IRC频道:#scikit-learn at http://irc.freenode.net

依赖包

  • scikit-learn支持Python2.6、Python2.7和Python2.5、Python3.4、Python3.3
  • 编译软件所需要的依赖包是NumPy >= 1.6.1, SciPy >= 0.9,C/C 编译器,在生产环境中需要安装Cython >=0.23,运行示例需要还安装Matplotlib >= 1.1.1,运行测试版本还需要安装nose >= 1.1.2。
  • scikit-learn同时使用CBLAS,一个基本线性代数子程序库的C接口。

安装

  • 默认安装再home文件夹根目录 python setup.py install --user
  • 在Unix/Linux系统为所有用户使用
  • python setup.py build sudo python setup.py install

贡献代码

  • 您可以使用以下命令查看最新的来源: git clone https://github.com/scikit-learn/scikit-learn.git
  • 关于如何设置环境的快速教程: https://github.com/scikit-learn/scikit-learn/blob/master/CONTRIBUTING.md
  • 在开始之前,请查看文档以确保您的代码符合指南要求: http://scikit-learn.org/stable/developers/index.html

测试

  • 安装完成后,您可以从源代码目录外启动测试用例(你需要先安装nose) $ nosetests -v sklearn
  • 在Windows下,建议使用下面的命令(调整python.exe程序路径)因为测试用例使用multiprocessing时,nosetests.exe程序与其交互性能差: C:Python34python.exe -c "import nose; nose.main()" -v sklearn

Github项目地址

scikit-learn:https://github.com/scikit-learn/scikit-learn

0 人点赞