前言 这里数据来源是很关键的一步,因为部分平台数据来源有一定异议,导致有误,这里我采用腾讯的数据来源。
1.确定数据源
数据源:腾讯疫情实时追踪
首先对该网站F12,点击Network刷新页面,看看每个页面的Response:
代码语言:javascript复制{"confirm":126286,"heal":117638,"dead":5696,"nowConfirm":2952,"suspect
确诊 治愈 死亡 现存确证 疑似病例
Response URL:
https://view.inews.qq.com/g2/getOnsInfo?
name=disease_h5&callback=jQuery35105860806421333924_1635943488534&_=1635943488535
但是再刷新一下会发现callback后面的东西就变了,推测这是一个时间戳,把它去了用这个:
代码语言:javascript复制https://view.inews.qq.com/g2/getOnsInfo?name=disease_h5
这个就是我的数据源了,现在开始码代码:
2.写代码
这里需要引入的数据块:
代码语言:javascript复制import json
import requests
import pandas as pd
from pyecharts.charts import *
from pyechrats import options as opts
from pyecharts.commons.utils import JsCode
from pyecharts.globals import ThemeType, chartType
from bs4 import Beautifulsoup
这里开始写抓取数据的代码: