PowerBI 疫情分析 之 全球数据获取

2020-04-27 10:25:25 浏览数 (3)

在此前我们发布了:疫情分析,很多小伙伴要求得到数据可以自己演练。

今天我们说两个事:

  • 直接使用规整的全球疫情数据
  • 20.04.15 20点 直播 某疫情作品 解析(作者参与)

直接使用疫情数据

很多新闻都采用来自约翰霍普金斯大学的研究:

该研究将全球疫情数据彻底开源化,大家可以直接使用。如下:

https://github.com/CSSEGISandData/COVID-19

可以直接基于该研究组织提供的数据来进行可视化分析,数据初始结构:

点击“Raw”可以查看原始数据的CSV格式。

在 PowerBI 中通过几步 PowerQuery 的变换就可以得到规整的数据来进行分析,如下:

这里有一个问题,由于是时间序列数据,也就是被透视过的“宽”数据,将被转换为:

这里有一个重点,就是系统默认识别了列数是 87,因为以后是要动态增长的,所以应自己将这个参数去掉。得到:

系统太智能了,又帮我们把类型给转换了,这就导致又固定了列数,导致以后刷新会失败,所以应该去掉这句。

再进行逆透视即可。

数据好了加载到数据模型,由于有了经纬度数据,很快地进行可视化即可。

这里使用经纬度来显示,如下:

感兴趣的伙伴可以私信我自己下载样例文件研究。

疫情作品 解析

周三晚上20点,我们邀请作品的作者一起解析一个作品:

0 人点赞