开篇 你一定要掌握的可视化图表
创作参考
废话不多说,开始正题。正所谓,一图胜千言,经常做数据分析的都知道,数据可视化是分析报告中的关键,一张或多张优秀的图表就足以突出结论,润色报告,获得boss的肯定。
这个系列将带大家熟悉常见的可视化图表,并基于python进行绘制。该系列文章主要基于Python Graph Gallery[1]进行二次创作,并大量参考matplotlib gallery[2]、seaborn gallery[3]、ployly gallery[4]、pyecharts[5]等可视化python库,另外也基于一些优秀的可视化网站(例如图形库[6]、数据可视化工具目录[7]等)对该系列内容进行了适当补充,同时借助了chatGPT对相关代码进行了优化、改错和重构。
常见的可视化图表类型
常见的可视化图表一般可分为以下七大类
- 分布(Distribution):主要用来观察数据的集中与发散,并发现异常值。常见的如直方图、密度图、箱线图、小提琴图、蜂群图、山脊图等
- 关系(Correlation):主要用来探索多变量之间的相关性。常见的如散点图、热图、相关矩阵图、气泡图、连接散点图、二维密度图等
- 比较(Ranking):主要用来观察不同类别数据间的差异。常见的如条形图、雷达图、词云图、平行线图、棒棒糖图、径向条形图、表格、指示器等
- 局部整体(Part Of A Whole):主要突出显示局部组成成分与整体的占比信息。常见的矩形树图、维恩图、饼图、圆环图、旭日图、树状图、圆形嵌套图、华夫饼图等
- 趋势(Evolution):主要是用来表示数据的变化趋势。常见的折线图、面积图、堆积面积图、流图、蜡烛图、螺旋图、日历热力图等
- 流程图(Flow):主要用来可视化呈现多个环节间的流量关系。常见的如弦图、网络图、桑基图、漏斗图等
- 地图(Map):主要用来探索空间数据。常见的如背景地图、山脊线地图、等值区域地图、六边形地图、变形地图、连接地图、气泡地图、散点地图等
思维导图
为了方便大家记忆和理解,这里整理了一份常见可视化图表的思维导图如下
总结
以上就是数据分析中常见的可视化图表,后续就是如何利用python去绘制基本的数据图表了~
共勉~
参考资料
[1]
Python Graph Gallery: https://python-graph-gallery.com/
[2]
matplotlib gallery: https://matplotlib.org/3.1.1/gallery/index.html
[3]
seaborn gallery: https://seaborn.pydata.org/examples/index.html
[4]
ployly gallery: https://plotly.com/python/
[5]
pyecharts: https://gallery.pyecharts.org/#/README
[6]
图形库: https://vis.zone/lib/
[7]
数据可视化工具目录: https://datavizcatalogue.com/ZH/index.html