最重要的话写在前面
1.新手/喜欢练习/欢迎交流/邀请/我是看着这个问题下面的答案学习的。
2。带着一个目的来学爬虫。
3.不要怂就是干!系统学习固然好,直接写一个项目出来效果更加简单粗暴。
4.哪里不会搜哪里!哪里报错改哪里!相信你遇到的99%的问题都能从网上找到相似的问题,你需要做的就是写代码!搜问题!调BUG!你搜不到解决办法的情况下,80%的情况是你搜索的姿势不对,另外20%可能需要你自己动动脑子,换个思路去做。
最后附上一些入门教程:
[Python]网络爬虫(一):抓取网页的含义和URL基本构成 [Python]网络爬虫(二):利用urllib2通过指定的URL抓取网页内容 [Python]网络爬虫(三):异常的处理和HTTP状态码的分类 [Python]网络爬虫(四):Opener与Handler的介绍和实例应用 [Python]网络爬虫(五):urllib2的使用细节与抓站技巧 [Python]网络爬虫(六):一个简单的百度贴吧的小爬虫 [Python]网络爬虫(七):Python中的正则表达式教程 [Python]网络爬虫(八):糗事百科的网络爬虫(v0.2)源码及解析 [Python]网络爬虫(九):百度贴吧的网络爬虫(v0.4)源码及解析 [Python]网络爬虫(十):一个爬虫的诞生全过程(以山东大学绩点运算为例) [Python]网络爬虫(11):亮剑!爬虫框架小抓抓Scrapy闪亮登场! [Python]网络爬虫(12):爬虫框架Scrapy的第一个爬虫示例入门教程