上次留了个尾巴:
1、给一个网址
2、给一个xpth定位
3、采集内容并保存到csv中
1、
Xpth定位嵌套不能2个双引号,要改为一个双引号一个单引号。
2、
3、
好,再完善一点东西
一、无头模式:PhantomJS(executable_path=r'C:UsersAdministratorDesktopphantomjs-2.1.1-windowsphantomjs-2.1.1-windowsbinphantomjs.exe')
二、xpath的错误
三、PhantomJS无头模式有可能出BUG,换Chrome,搞定。
四、点击翻页。搞定
driver.find_element_by_class_name('pager_next ').click()
五、点击掉公告
driver.find_element_by_xpath('/html/body/div[9]/div/div[2] ').click()
六、爬取多个信息
五、整理一个完整的。
最后把数据导入可视化