这是 Python 数据可视化系列的第四节《Seaborn 中》。
Python 数据可视化
- Matplotlib 上
- Matplotlib 下
- Seaborn 上
之前 Python 数据分析和基础系列的所有课程链接如下。
Python 数据分析
- NumPy 上
- NumPy 下
- Pandas 上
- Pandas 下
- SciPy 上
- SciPy 下
- Pandas 时间序列
- Pandas 高频数据采样
- 默顿模型计量经济资本
- LSMC 定价美式和百慕大期权
- 负油价和负利率模型
- Nelson-Siegel 构建债券收益率曲线
- 外汇交易组合保证金制定系统
- FR007 利率掉期定价和曲线拔靴
- 量化投资 - 向量化回测
Python 基础
- 编程概览
- 元素型数据
- 容器型数据
- 流程控制:条件-循环-异常处理
- 函数上:低阶函数
- 函数下:高阶函数
- 类和对象:封装-继承-多态-组合
- 字符串专场:格式化和正则化
- 解析表达式:简约也简单
- 生成器和迭代器:简约不简单
- 装饰器:高端不简单
Seaborn 中关注的内容是第 2 章,单图。
1. Seaborn 101
- 场景设定
- 风格设定
- 色调设定
- 图级轴级
- Seaborn 数据集
2. 单图
- 关系图
- 分布图
- 分类图
- 回归图
- 矩阵图
3. 组合图
- 多图网格
- 配对网格
- 联合网格
统计分析就是去理解一个数据集中变量之间的关系,以及这些关系如何受到其他变量的影响。Seaborn 的主要用处就是可视化这个过程。当数据以恰当的方式展示出来时,读者可以直观地观察到某些趋势并发现变量之间的关系。
在 Seaborn 中绘图函数命名非常讲究,在顶层的 relplot(), displot() 和 catplot() 旨在绘制出关系图、分布图和分类图,而在每个函数中设置参数 kind 来细分具体图的类型,如下图所示。
除了在上述三种顶层函数中设置参数 kind,还可以用具体名称的函数实现相似的可视化目标,比如
本节分别从单图和组合图的角度来展示 Seaborn 的绘图功能,单图种类包括
- 关系图 (relational plot) 显示两个定量变量之间的关系
- 分布图 (distributional plot) 显示定量变量的分布
- 分类图 (categorical plot) 显示定量变量在分类变量下每个类别的分布
- 回归图 (regression plot) 包括线性回归图、多项式回归图和残差图
- 矩阵图 (matrix plot) 包括热力图和聚类图
内容太多了,每种图发一张例图吧。
关系图
散点图
线形图
分布图
直方图
KDE 图
ECDF 图
地毯图
分类图
条纹图
蜂群图
箱型图
提琴图
条形图
计数图
点图
回归图
回归图
残差图
矩阵图
热力图
聚类图