代码语言:javascript复制
</pre><pre>
最近需要用到selenium浏览器抓取,在windows下对照chrome浏览器开发的代码,在linux服务器上换成phantomjs驱动后,却不能运行了,通过截图发现phantomjs渲染效果和chrome不同。于是考虑在centos上安装chrome浏览器。
下面是做的一些记录。
1,centos7 安装 google-chrome
(1) 添加chrome的repo源
vi /etc/yum.repos.d/google.repo
[google]name=Google-x86_64baseurl=http://dl.google.com/linux/rpm/stable/x86_64enabled=1gpgcheck=0gpgkey=https://dl-ssl.google.com/linux/linux_signing_key.pub
(2)安装
yum update , 然后yum install google-chrome-stable
这时候在非root账号下运行google-chrome会输出没有显示器,无法启动之类的。
不知道为什么不能在root账号下运行。
2, 安装Xvfb
yum update
yum install Xvfb
yum -install libXfont
yum install xorg-x11-fonts*
3, 一个小测试
(1)安装selenium、pyvirtualdisplay
pip install selenium
pip install pyvirtualdisplay
(2)下载chromedriver
从https://sites.google.com/a/chromium.org/chromedriver/home下载chromedriver
配置在PATH路径或者在脚本中指定路径
(3) demo
vim test.py
代码语言:javascript复制
-
# -*- coding:utf-8 -*-
-
from selenium import webdriver
-
from pyvirtualdisplay import Display
-
display = Display(visible=0, size=(800,600))
-
display.start()
-
driver = webdriver.Chrome("./chromedriver")
-
driver.get("http://www.baidu.com")
-
print driver.page_source
-
driver.quit()
-
display.stop()
期望输出百度首页的html文档。
4 ,selenium server
1, nohup Xvfb -ac :7 -screen 0 1280x1024x8 > /dev/null 2>&1 &
2, export DISPLAY=:7
3, java -jar selenium-server-standalone-3.0.1.jar
4,
代码语言:javascript复制
-
<pre name="code" class="python"># -*- coding:utf-8 -*-
-
from selenium import webdriver
-
from selenium.webdriver.common.desired_capabilities import DesiredCapabilities
-
driver = webdriver.Remote(
-
command_executor='http://127.0.0.1:4444/wd/hub',
-
desired_capabilities=DesiredCapabilities.CHROME)
-
driver.get("http://www.baidu.com")
-
print driver.page_source
-
driver.quit()
(adsbygoogle = window.adsbygoogle || []).push({});