Python大数据分析
记录 分享 成长
经常听到初学python的小伙伴在抱怨,python安装第三方库太慢,很容易失败报错,如果安装pandas、tensorflow这种体积大的库,简直龟速。
为什么pip会很慢?
先来了解下pip,pip是一个非常流行的python包管理工具,在命令行中只需要输入pip install package_name
,就可以自动安装第三方库。然而pip是从pypi中下载库文件的,pypi是python官方第三方库的仓库,它用的是国外的服务器,下载速度自然很慢。
所以不是pip慢,而是pypi慢。
有一种方法可以解决安装慢的问题,那就是通过国内镜像网站下载。镜像网站完整复制pypi的内容,放到国内的服务器上。这样你只需要把pip的下载源修改为镜像站,就能享受流畅快速的pip安装功能了。
临时配置
简单的举个例子,用清华镜像源来安装第三方库,在命令行输入:
代码语言:javascript复制pip install -i https://pypi.tuna.tsinghua.edu.cn/simple package_name
以安装pandas来说明一下,不替换镜像源情况下:
代码语言:javascript复制pip install pandas
替换为清华镜像源:
代码语言:javascript复制pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pandas
清华pypi的镜像源每五分钟更新一次,大而全,推荐大家使用,下面是网址:
代码语言:javascript复制https://pypi.tuna.tsinghua.edu.cn/simple
国内还有其他镜像源可供选择:
代码语言:javascript复制豆瓣
http://pypi.douban.com/simple/
阿里
http://mirrors.aliyun.com/pypi/simple/
中国科学技术大学
http://pypi.mirrors.ustc.edu.cn/simple/
永久配置
上面的用法是临时配置,也就是说每次安装库时必须带上镜像源的网址。其实这样不太方便,若想省力气,那就要永久配置镜像源,配置好后只要输入pip install package_name
,就可以快速安装库了。
永久配置镜像源也简单,分为两种方法,自动和手动。
自动配置,以配置清华源为例,在命令行输入:
代码语言:javascript复制pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple
执行后就配置好了。
手动配置,windows下,直接在user目录中创建一个pip目录,再新建文件pip.ini。(例如:C:Userszhupippip.ini)
接着打开pip.ini文件,复制粘贴以下内容并保存。
代码语言:javascript复制[global]
index-url = https://pypi.tuna.tsinghua.edu.cn/simple
配置成功。
镜像网站的好处
国内的这些镜像网站拥有非常多的开源工具,不光是pypi,你还可以在里面下载mysql、anaconda、ubuntu、nodejs等主流软件,速度杠杠的。
以下是中科大镜像站,基本啥都有,网址:https://mirrors.ustc.edu.cn/
ubuntu |
---|