正所谓条条道路通罗马,上次我们使用了Selenium自动化工具来爬取网易云的音乐评论,Selenium自动化工具可以驱动浏览器执行特定的动作,获得浏览器当前呈现的页面的源代码,做到可见即可爬,但需要等网页完全加载完,也就是JavaSc...
今天带大家实践一把爬取整站小说,当然只是出于学习目的,大家千万不要应用于商业应用,因为可能出现侵权问题。本教程默认大家已经安装了scrapy,并且熟悉python语法。我们将逐步解析网站,然后将小说爬取保存到本地。...
3、打开https://www.lfd.uci.edu/~gohlke/pythonlibs/,找到twisted和lxml两个whl文件,下载下来。