python爬虫网页解析之parsel模块

2019-09-11 14:23:29 浏览数 (2)

08.06自我总结

python爬虫网页解析之parsel模块

一.parsel模块安装

官网链接https://pypi.org/project/parsel/1.0.2/

pip install parsel==1.0.2

二.模块作用

改模块主要用来将请求后的字符串格式解析成re,xpath,css进行内容的匹配

三.使用

代码语言:javascript复制
import requests
import parsel


response = requests.get(url)
sel = parsel.Selector(response.text)  #注意这里的S要大写

# re正则
# print(sel.re('正则匹配格式'))

# xpath
# print(sel.xpath('xpath').getall()) #getall获取所有

# css选择器
# print(sel.css('css选择器 ::text').extract_first())#获取第一个

0 人点赞