2021兰州疫情-新型冠状病毒疫情实时爬虫-3(实时更新)

2022-03-22 15:00:16 浏览数 (3)

前言 这里数据来源是很关键的一步,因为部分平台数据来源有一定异议,导致有误,这里我采用腾讯的数据来源。

1.确定数据源

数据源:腾讯疫情实时追踪

首先对该网站F12,点击Network刷新页面,看看每个页面的Response:

代码语言:javascript复制
{"confirm":126286,"heal":117638,"dead":5696,"nowConfirm":2952,"suspect
     确诊              治愈             死亡            现存确证            疑似病例

Response URL:
https://view.inews.qq.com/g2/getOnsInfo?  
name=disease_h5&callback=jQuery35105860806421333924_1635943488534&_=1635943488535

但是再刷新一下会发现callback后面的东西就变了,推测这是一个时间戳,把它去了用这个:

代码语言:javascript复制
https://view.inews.qq.com/g2/getOnsInfo?name=disease_h5

这个就是我的数据源了,现在开始码代码:

2.写代码

这里需要引入的数据块:

代码语言:javascript复制
import json
import requests
import pandas as pd
from pyecharts.charts import *
from pyechrats import options as opts
from pyecharts.commons.utils import JsCode
from pyecharts.globals import ThemeType, chartType
from bs4 import Beautifulsoup

这里开始写抓取数据的代码:

0 人点赞