最新 最热

21.8 Python 使用BeautifulSoup库

BeautifulSoup库用于从HTML或XML文件中提取数据。它可以自动将复杂的HTML文档转换为树形结构,并提供简单的方法来搜索文档中的节点,使得我们可以轻松地遍历和修改HTML文档的内容。广泛用于Web爬虫和数据抽取应用程序中...

2023-10-27
2

使用BeautifulSoup解析豆瓣网站的HTML内容并查找图片链接

爬取豆瓣网图片的用途广泛。首先,对于雕塑和学者来说,爬取豆瓣图片可以用于文化研究、社会分析等领域。通过分析用户上传的图片,可以了解不同文化背景下的审美趋势和文化偏好,为相关研究提供数据支持。...

2023-10-23
2

Python 爬虫之 request+beautifulsoup+mysql

一、什么是爬虫?它是指向网站发起请求,获取资源后分析并提取有用数据的程序;爬虫的步骤:

2023-09-14
2

数据获取:​网页解析之BeautifulSoup

Beautiful Soup也有很多版本,不过Beautiful Soup3已经停止更新了,目前最新的都是Beautiful Soup4,而且也已经移植到bs4库中,我们安装bs4库后就可以直接使用。安装库使用pip安装,安装命令:...

2023-09-02
1

使用Python分析数据并进行搜索引擎优化

在互联网时代,网站数据是一种宝贵的资源,可以用来分析用户行为、市场趋势、竞争对手策略等。但是,如何从海量的网页中提取出有价值的信息呢?答案是使用网络爬虫。...

2023-08-11
1

网络数据采集之抓取简单页面链接

这里当然是ctrl+v的课本啦,重在学习 BeautifulSoup 的这个的四个对象类型。

2023-03-09
2

BeautifulSoup文档5-详细方法 | 修改文档树应该注意什么?

BeautifulSoup本身最强大的功能是文档树的搜索;但也可以修改文档树。1 修改tag的名称和属性soup = BeautifulSoup(&#x27;<b class="boldest">Extremely bold</b>&#x27;, &#x27;html.parser&#x27;)tag = soup.bprint(f"...

2023-02-23
2

BeautifulSoup文档4-详细方法 | 用什么方法对文档树进行搜索?

BeautifulSoup的文档搜索方法有很多,官方文档中重点介绍了两个方法:find() 和 find_all() 下文中的实例,依旧是官网的例子:html_doc = """<html><head><title>The Dormouse&#x27;s story</title></head><body><p cl......

2023-02-22
1

BeautifulSoup文档3-详细方法 | 如何对文档树进行遍历?

以下实例还是官网的例子:html_doc = """<html><head><title>The Dormouse&#x27;s story</title></head> <body><p class="title"><b>The Dormouse&#x27;s story</b></p><p class="stor...

2023-02-22
2

BeautifulSoup文档2-详细方法 | 对象的种类有哪些?

1 使用细节将一段文档传入BeautifulSoup 的构造方法,就能得到一个文档的对象,;可以传入一段字符串或一个文件句柄,比如:from bs4 import BeautifulSoupsoup = BeautifulSoup(open("index.html"))soup = BeautifulSo......

2023-02-21
1