安装Selenium

2021-06-01 14:30:32 浏览数 (2)

简介

自动化测试,顾名思义就是让浏览器自动运行,而无需手动操作。这和我们爬虫工作原理有些相似,我们爬虫也需要让浏览器运行网址来获取我们需要的内容。所以我们今天来介绍一款自动化测试工具—— Selenium ,并将它运用到爬虫中来。

它的官网标题后面副标题是“Web Browser Automation”,什么意思?直译过来就是 Web 浏览器自动化,很直白很明显对不对?

我们再来看看官网的定义:

代码语言:javascript复制
Selenium automates browsers. That’s it! What you do with that power is entirely up to you. Primarily, it is for automating web applications for testing purposes, but is certainly not limited to just that. Boring web-based administration tasks can (and should!) be automated as well.

Selenium has the support of some of the largest browser vendors who have taken (or are taking) steps to make Selenium a native part of their browser. It is also the core technology in countless other browser automation tools, APIs and frameworks.

从这两段定义来看,大意就是 Selenium 的初衷是为 Web 应用自动化测试而生,但是它的用处不限于此,怎么使用完全取决于你。你可以用它来自动化处理一些基于 Web 的任务。各大浏览器厂商也将 Selenium 嵌入到它们的浏览器中了。 Selenium 也广泛应用于其他的自动化工具、 API 和框架中。

Selenium 的环境搭建

安装 Selenium 工具包

跟其他 Python 工具包一样,有两种安装方式: 一种是命令行安装:

代码语言:javascript复制
pip install -U selenium

另一种是下载 Python 安装包文件,然后再手动安装。下载地址为 https://pypi.org/project/selenium/#files ,下载后解压压缩包,然后用命令行进入该压缩包的根目录,输入命令进行安装:

代码语言:javascript复制
python setup.py install

安装浏览器驱动

对于 Selenium 3,要使用其功能,我们需要安装浏览器驱动。每个浏览器厂家都有自己的驱动,本文以 Chrome 浏览器为例,向大家介绍怎么安装浏览器驱动。

Chrome 的每个浏览器版本都会有对应版本的驱动, 所以我们第一步是要知道我们浏览器的版本。 Chrome 浏览器的版本信息在“设置->关于 Chrome”里面可以找到,具体可以参照下图:

找到浏览器版本后,我们到 http://chromedriver.storage.googleapis.com/index.html 下载对应的 chromedriver 。以前的老版本都是2.x的版本,大家需要到网上搜一下版本对应关系。 Chrome 从版本70之后就很好找了,所以建议大家将 Chrome 版本升级至最新的,驱动也好找些。

进入每个具体的 chromedriver 版本目录之后,我们可以看到下面这样的页面:

大家根据自己的操作系统,选择对应的文件下载即可。

下载完成后,解压压缩包,会得到 chromedriver 的驱动。不同的操作系统有不同的安装方式:

Windows 操作系统的安装关键步骤是:

代码语言:javascript复制
① 把下载成功的驱动包chromedriver.exe解压出来,放在谷歌浏览器安装目录下的Application目录中(鼠标右键点击谷歌图标,选择属性,可在起始位置查看谷歌目录)。
② 然后配置系统环境变量在path中添加chromedriver.exe的路径。
③ 将chromedriver.exe放在C盘中windows文件夹下的SysWOW64,如果是32位系统则放在System32中。

Mac 系统安装驱动在网上搜索可以搜到两种方法:

  • 第一种将 chromedriver 复制到 /usr/bin 目录下;
  • 第二种将 chromedriver 复制到 /usr/local/bin 目录下;

笔者采取的是第二种方案,因为第一种方案存在一个问题: Mac 对 /usr/bin 这个路径有权限的限制,即使你是 root 用户,也无法正常移动文件过去,这时,需关闭 Mac 的 SIP 方法 ,具体操作可参考:https://jingyan.baidu.com/article/e5c39bf5d13bf939d76033cf.html 。

至于网上说的将 chromedriver 驱动文件复制到 /usr/bin 或者 /usr/local/bin 后,需要在环境变量里面配置相应的目录,笔者试过不配置也没问题,当然配置了也不会出问题,所以为了省事,可以不用配置。

接下来,我们在命令行输入如下命令就可以查看我们的 chromedriver 版本了:

代码语言:javascript复制
chromedriver –version
代码语言:javascript复制
lihuandeMacBook-Pro:~ lihuan$ chromedriver –version
Starting ChromeDriver 90.0.4430.24 (4c6d850f087da467d926e8eddb76550aed655991-refs/branch-heads/4430@{#429}) on port 9515
Only local connections are allowed.
Please see https://chromedriver.chromium.org/security-considerations for suggestions on keeping ChromeDriver safe.
ChromeDriver was started successfully.

看到这个就表示 Chrome 驱动安装成功了。

现在我们来用最简单的语句测试一下,看能不能运行 Selenium:

代码语言:javascript复制
from selenium import webdriver

browser = webdriver.Chrome()
browser.get('http://www.baidu.com/')

运行上面的程序,我们会发现弹出来 Chrome 浏览器窗口,并打开了百度首页,这就代表我们的程序正常运行了,我们的环境配置成功了。

0 人点赞