最新 最热

使用c#和selenium获取网页

selenium 和 c# 的应用之一是创建一个网络爬虫,它可以从网页中抓取数据进行分析。网络爬虫是一种访问网页并从中提取信息的程序。 Selenium 是一个框架,它允许我们自动执行浏览器操作,例如单击、键入或导航。 C# 是一种...

2023-06-12
1

python爬取共享单车悄然涨价大众的评论数据

2015年共享经济像雨后春笋般崛起,风口之下,市场上涌现出共享单车、共享充电宝、共享雨伞、共享健身房、共享玩具、共享服装等一系列共享经济产物。但是经过此后几年行业洗牌重塑,共享单车保留了下来。...

2023-06-07
0

python如何获取动态页面数据

在日常使用python爬取数据的时候会遇到一些动态页面,有些网页的HTML代码是由javascript动态生成的,直接爬取可能会出现无法加载的情况,需要用phantomJS和selenium模拟浏览器,之后再爬取。...

2023-06-05
1

如何多方面的优化python爬虫程序速度

在日常爬取数据的过程中,会遇到爬虫程序变的很慢的问题。爬虫代理IP网络延迟高、爬取数据量过大、爬虫程序设计问题、不合理的请求头设置、Python 解释器性能问题等都是制约爬虫速度的重要因素。总之,在遇到 Python 爬...

2023-05-30
1

python中urllib的使用

urllib库是Python中一个最基本的网络请求库。可以模拟浏览器的行为,向指定的服务器发送一个请求,并可以保存服务器返回的数据。

2023-05-25
0

如何采集javascript动态加载网页

从一个运行 javascript 的网站加载所有数据来加载内容,目前的问题是当运行启动代码时它无法加载 javascript 内容,因为用户应该向下滚动才能加载。如何编写启动代码来滚动整页呈现 javacript 并返回 html呢?...

2023-05-24
1

python爬虫常见状态码之504错误

python爬虫请求网站然后抓取数据返回的过程之中,实际上是通过http超文本传输协议将自己的请求信息发送到了网站上等待响应,而网站响应之后就会返回状态码以及相关的数据回去。我们需要快速地对http请求返回的各种异常状...

2023-05-23
0

python爬取叮咚买菜评价数据

疫情这这几年,线上买菜成了大家日常生活的一部分,出现了叮咚买菜,京东到家,朴朴超市等app,这些买菜app我们可以买到新鲜蔬菜、水果、肉禽蛋、米面粮油、水产海鲜、南北干货、方便速食等等。对上班族来说真的是很方便的软件...

2023-05-22
0

Selenium+代理爬取需要模拟用户交互的网站

在日常爬虫采集网站的过程中,部分数据价值较高的网站,会限制访客的访问行为。这种时候建议通过登录的方式,获取目标网站的cookie,然后再使用cookie配合代理IP进行数据采集分析。今天我们就介绍下如何使用Selenium库来爬取...

2023-05-18
0

python爬虫带你了解油价新走势

5月16日24时,国内新一轮成品油调价窗口将开启。继上轮成品油价格下跌后,机构预计本轮成品油价格或继续下跌,有望迎来年内“最大跌幅”,根据机构测算,全国大部分地区95号汽油有望回归“7元时代”。...

2023-05-16
0