导读
数据可视化是整个数据分析流程中的关键环节,甚至有着一图定成败的关键性地位。前期,陆续推出了matplotlib和seaborn详细入门教程,对于常规的数据探索和基本图表制作是足够的,但二者的一个共同短板是图表不可交互,缺少那种活灵灵的样子!当Python遇到百度echarts,pyecharts便应用而生,最重要的是支持交互、且可移植到PPT报告中,这效果简直是再理想不过的。
pyecharts4步输出图表
pyecharts可视化图表制作相比matplotlib和seaborn而言,其实是更为简单的,因为它几乎所有图表都遵循了"同一套路",没有过多复杂参数、无需细节技巧牵绊。但同时,它又有二者所不具备的一些优点:
- 简洁的API设计,支持链式调用
- 多种主题可选,丰富的参数设置
- 可交互的可视化效果,且可移植到PPT中
- 提供了常用图表类型接口,包括matplotlib和seaborn不支持的一些图表:例如词云、可视化地图等
基于以上这些原因,pyecharts是个人在可视化输出过程中应用仅次于matplotlib和seaborn的第三大可视化库。当然,各可视化库都有其各自擅长场景,本无优劣高下之分。本文旨在介绍pyecharts图表制作中最基础的套路,掌握这些基本操作、再辅以官网详尽教程,基本上常规图表都是可以的!
个人认为学习pyecharts无需熟记各类参数,而仅需掌握通用原理和流程即可,具体操作可待实际应用时查阅相应源码和官网教程。所以本文给出的是一份极简教程,而不会逐一介绍面面俱到。
1. 设置通用项
与seaborn类似,pyecharts也提供了多个通用设置项,包括图表主题、生成文件类型等,一般保持默认即可得到较为不错的图表,但希望尝试新的风格时则可调用主题接口。主题设置作为具体图表的一个初始化参数进行设置,例如:
代码语言:javascript复制from pyecharts.charts import Bar
from pyecharts import options as opts
from pyecharts.globals import ThemeTyp
#主题选择作为图表初始化参数进行设置
bar = Bar(init_opts=opts.InitOpts(theme=ThemeType.PURPLE_PASSION))
另一个通用项设置中较为实用的是notebook选项,这在使用jupyter notebook或者jupyter lab中是必不可少的一项,默认为jupyter notebook方式。在jupyter lab中加入以下两行通用设置后,即可调用render_notebook()在cell中查看图表结果:
代码语言:javascript复制from pyecharts.globals import CurrentConfig, NotebookType
CurrentConfig.NOTEBOOK_TYPE = NotebookType.JUPYTER_LAB
2. 选择图表
pyecharts提供了几乎常用的所有图表类型,除了柱状图、折线图、饼图、散点图这4大通用可视化图表外,还包括词云、地图、箱线图、K线图等专用图表,另外,pyecharts也提供了常用图表的3D形式,对于多类型图表组合则提供了Page、Grid、Tab和Timeline4种形式,可将其看做是单图表的容器,例如Timeline的一个简单案例:原来用pyecharts画个时间线图这么简单。
在确定图表类型(图表实例化)后则是添加数据。pyecharts在迭代1.0版本后,一个最大的特色就是支持链式调用,所以添加数据也是极其方便的。
这里有必要解释下何为链式调用。可能很多pyecharts初学者在查阅官方文档时会看到如下写法(这里选用官网上直方图的一个demo):
代码语言:javascript复制from pyecharts import options as opts
from pyecharts.charts import Bar
from pyecharts.faker import Faker
c = (
Bar()
.add_xaxis(Faker.choose())
.add_yaxis("商家A", Faker.values())
.add_yaxis("商家B", Faker.values())
.set_global_opts(
title_opts=opts.TitleOpts(title="Bar-Brush示例", subtitle="我是副标题"),
brush_opts=opts.BrushOpts(),
)
.render("bar_with_brush.html")
)
这个链式调用将图表的实例化、添加数据、设置参数、输出结果放在了一句代码执行,对新人更为不友好的是将这些代码放在了一组圆括号之中,搞得云里雾里(至少在我初学时是这样的),实际上理解这段代码需要掌握两个知识点:
- Python中可将单个表达式或单个语句放在一组圆括号内实现跨行书写,例如下面例子中,写法1合法,而写法2报错,区别仅在于有无圆括号
- pyecharts将图表类的每个方法都返回了self本身,这样每个方法的返回值都是该图表实例,进而实现链式调用
实际上,这种链式调用在机器学习库中是非常常见的一种设计,学过sklearn的读者应该都了解一行代码实现*.fit().score()的优雅写法。
理解了链式调用背后的原理,则很容易弄懂上面的代码:实际上其等价于如下形式:
代码语言:javascript复制from pyecharts import options as opts
from pyecharts.charts import Bar
from pyecharts.faker import Faker
c = Bar() # 1.实例化
c.add_xaxis(Faker.choose()) # 2.添加x轴标签
c.add_yaxis("商家A", Faker.values()) # 3.添加y轴数据A
c.add_yaxis("商家B", Faker.values()) # 4.添加y轴数据B
c.set_global_opts(
title_opts=opts.TitleOpts(title="Bar-Brush示例", subtitle="我是副标题"),
brush_opts=opts.BrushOpts(),
) # 5.添加通用设置项
c.render("bar_with_brush.html") # 6.输出html图表结果
6句代码调用了6个接口,分别完成:
- 实例化一个直方图对象
- 添加x轴数据
- 添加y轴数据A
- 添加y轴数据B
- 设置通用参数,包括标题、区域圈选等
- 输出html图表文件
掌握了这一基本套路,基本上就理解了pyecharts输出可视化图表的通用方法。
3. 设置图表参数
pyecharts提供了3类图表参数设置类型,分别是图表设置项、通用设置项、系列设置项,其中:
- 图表设置项是具体到某个特定图表对象的设置参数,各图表可选设置参数不同
- 通用设置项最为常用,例如图表初始化设置就属于通用设置中的一项,另外包括标题、坐标轴、可视化缩放条等都属于通用设置项
- 系列设置项则可以用于设置图表的某些具体参数,例如label可设置数据标签是否显示以及位置等
对应相应设置项,pyecharts分别提供了设置接口:
代码语言:javascript复制set_global_opts()
set_series_opts()
4. 输出结果
最后,pyecharts提供了将可视化图表输出的方式,实际较为常用的有两种:
- render()输出到网页中
- render_notebook()在jupyter中即时显示,具体区分notebook和jupyter lab两种,可在全局参数中设置
此外,pyecharts还提供了其他多种图表输出形式,例如make_snapshot()可直接输出为png图片。但如此一来则失去交互能力。
pyecharts作为百度出echarts可视化库与Python的结合体,其在制作可交互图表方面具有很好的效果,且更重要的是相较于其他可视化库学起来更易上手。如果说有什么明显缺点的话,那么可能是其支持数据类型较为传统:即仅支持Python基础的数据结构,对数据科学库的数据类型(如ndarray和dataframe)则不适用,这是由其定位所决定的。