python爬虫之xpath的基本使用

2022-07-13 18:49:28 浏览数 (6)

要先将源码etree

代码语言：javascript复制

html = requests.get(=url=headers).text
html = etree.HTML(html)
html = etree.tostring(html=).decode()
html.xpath('/html/body/div/ul/li/a[@href="link2.html"]/text()')

或将html.text转换为选择器对象

代码语言：javascript复制

import parsel

html = parsel.Selector(html_str)
url = html.xpath('//div').extract()

html text 对象源码

0 人点赞