在此前我们发布了:疫情分析,很多小伙伴要求得到数据可以自己演练。
今天我们说两个事:
- 直接使用规整的全球疫情数据
- 20.04.15 20点 直播 某疫情作品 解析(作者参与)
直接使用疫情数据
很多新闻都采用来自约翰霍普金斯大学的研究:
该研究将全球疫情数据彻底开源化,大家可以直接使用。如下:
https://github.com/CSSEGISandData/COVID-19
可以直接基于该研究组织提供的数据来进行可视化分析,数据初始结构:
点击“Raw”可以查看原始数据的CSV格式。
在 PowerBI 中通过几步 PowerQuery 的变换就可以得到规整的数据来进行分析,如下:
这里有一个问题,由于是时间序列数据,也就是被透视过的“宽”数据,将被转换为:
这里有一个重点,就是系统默认识别了列数是 87,因为以后是要动态增长的,所以应自己将这个参数去掉。得到:
系统太智能了,又帮我们把类型给转换了,这就导致又固定了列数,导致以后刷新会失败,所以应该去掉这句。
再进行逆透视即可。
数据好了加载到数据模型,由于有了经纬度数据,很快地进行可视化即可。
这里使用经纬度来显示,如下:
感兴趣的伙伴可以私信我自己下载样例文件研究。
疫情作品 解析
周三晚上20点,我们邀请作品的作者一起解析一个作品: