0. 引言
自从机器学习大火起来以后,做机器学习最热门的语言应该说是非Python莫属,原因大致有以下几个方面:1. Python语言简单易学,语法简单灵活;2. Python的科学计算库非常丰富,减少了机器学习库构建过程中的重复开发;3. Python社区的活跃以及Google等互联网巨头对python的支持等等。
用Python做机器学习,最常用的库就是scikit-learn。接下来,我就介绍一下如何在Windows中安装并成功运行scikit-learn。
1. 安装Python
首先,我们需要安装python环境。本人选择的是64位版本的Python 3.5。去Python官网https://www.python.org/选择相应的版本并下载。如下如所示:
接下来安装,并最终选择将Python加入环境变量中。
2. 安装必要的依赖包
去网址:http://www.lfd.uci.edu/~gohlke/pythonlibs/ 中去下载你所需要的如下两种包:
- numpy-1.12.1 mkl-cp35-cp35m-win_amd64.whl
- scipy-0.19.0-cp35-cp35m-win_amd64.whl
运行Windows 命令行运行程序cmd,并将当前目录转到这两个文件所在的目录下。并依次执行如下操作安装这两个包:
代码语言:text复制>> pip install numpy-1.12.1 mkl-cp35-cp35m-win_amd64.whl>> pip install scipy-0.19.0-cp35-cp35m-win_amd64.whl
3. 安装 Scikit-learn
执行如下命令安装scikit-learn机器学习库:
代码语言:text复制>> pip install -U scikit-learn
4. 测试安装是否成功
代码语言:javascript复制>>> from sklearn import svm
>>> X = [[0, 0], [1, 1]]>>> y = [0, 1]
>>> clf = svm.SVC()
>>> clf.fit(X, y)
>>> clf.predict([[2., 2.]])
array([1])
如果如上所述正确输出,则表示安装完成。否则就需要检查安装步骤是否出错,或者系统是否缺少必要的Windows依赖库。常用的一般情况会出现缺少VC 运行库,在Windows 7、8、10等版本中安装Visual C 2015基本上就能解决问题。