大家好,我是小五。
今天上海市卫健委通报:2022年4月20日0—24时,新增本土新冠肺炎确诊病例2634例和无症状感染者15861例。最近两天的新增数据有所下降,出院人数也开始超过每日新增阳性患者数量。但形势仍然不容乐观,尤其外溢导致区域抗疫变成了全国抗疫。
今天不会再出一版上海疫情数据报告,而是干脆教大家如何进行疫情数据可视化。
数据采集
虽然一直没在写上海疫情相关的文章,但我也一直在保持收集相关数据。数据来源便是上海市卫健委的公告,每天会将其下载到本地方便进行数据提取,如下图左所示。
接着便可以利用Python编程提取每日的数据,并保存到本地Excel中。
数据可视化
在前面的文章中,其实我主要用了两个工具进行可视化。
类似上图这种折线图,估计大家一眼就能看出是Excel绘制的。而那些从多个角度分析上海新冠疫情的趋势和各个行政区形势的可视化图表,其实都是用一个可视化神器做的。还记得我之前分享的 这种动态条形图 折线图怎么做 吗?其实使用的都是同一个工具。
打开网页:https://sourl.cn/mcaqRG
就会看到各种各样的图表模板,不仅有我们之前分享过的动态折线排名图、动态折线变化图,也包括进行疫情数据可视化常用的堆叠柱状图和区域地图等。而且这些图表模板基本都是免费的,直接就能用。
以区域地图的绘制为例,我们可以尝试进行疫情数据可视化。
如上图所示,我们计算得到了某段时间疫情数据,接下来便可以打开网页https://sourl.cn/mcaqRG,选择自己所需的图表模板。
比如我们选择了分级区域地图后,需要先选择地图区域,这里由于要绘制上海疫情地图,就选择上海市即可。
可以看到,此时的图表与我之前分享给大家的可视化结果已经很相似了。下一步便是导入数据,修改细节(如下图所示,右侧为工具框)。
导入数据
最后,根据自己的喜好调整细节就可以得到类似的数据可视化图表了。
如果想保存自己刚刚的可视化作品,可以点击上图右上角的【下载】、【分享】按钮,一个是下载到本地,一个是生成在线网页链接。
当然,你也可以选择自己喜欢/合适的图表模板进行疫情数据可视化。
在我连续更新三次上海的疫情数据后,经常有同学来问还要不要继续更新呀,或者问这么好看的图表是用Python绘制的吗?
授人以鱼不如授人以渔,今天干脆就一步一步教给大家了,感兴趣的同学可以自己去试试。觉得分享的不错的朋友,麻烦给右下角点个赞再走吧!
其实我这个人呢,做数据可视化时什么顺手用什么。Excel也好,Python也罢,亦或是各种在线可视化网站都是更有优势。但是如果你要是用Tableau进行数据可视化,我一会推荐你一本经典书《数据可视化分析:Tableau原理与实践》。
本书系统地讲解了Tableau Prep Builder和Tableau Desktop的原理与实践应用。全书以可视化分析、Tableau计算为重点,详细介绍了如何理解数据的层次、如何使用Tableau Prep Builder整理和准备数据、如何使用Tableau Desktop开展敏捷数据分析、Tableau高级互动,特别是深入介绍了Tableau的各种计算,从而以有限的数据实现无限的业务场景分析。