以爬取我自己的博客源码为例子:
代码语言:javascript复制import requests
from pyquery import PyQuery as pq
header={
'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_3) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.162 Safari/537.36'
}#请求头
url='https://blog.csdn.net/weixin_46211269/article/details/113728894'
page=requests.get(url=url,headers=header).content.decode('utf-8')
# print(page)
#方法一
file=open('yuan.txt','w',encoding='utf-8')
file.write(page)
file.close()
#方法二(这种好一些)
with open('wen.txt','w',encoding='utf-8') as f:
f.write(page)
差不多就两种方法,个人喜欢第二种。w是写入,没有wen.txt文件就创建txt文件,有就直接写入。别的没啥说的,记录一下今天学习。