python数据可视化神器--pyecharts 快速入门

2019-12-03 13:27:29 浏览数 (1)

前言

我们都知道python上的一款可视化工具 matplotlib , 但是它是静态的。后来发现了 pyecharts 模块,简直好用到不行,可视化类型非常多,它是基于 Echarts 开发的。

Echarts 是百度开源的一个数据可视化 JS 库,凭借着良好的交互性,精巧的图表设计,得到了众多开发者的认可。而 Python,很适合用于数据处理。当数据分析遇上数据可视化时,pyecharts 就诞生了。

下面带大家快速了解 pyecharts 以及基本使用方法:

✨ 特性

  • 简洁的 API 设计,使用如丝滑般流畅,支持链式调用
  • 囊括了 30 种常见图表,应有尽有
  • 支持主流 Notebook 环境,Jupyter Notebook 和 JupyterLab
  • 可轻松集成至 Flask,Django 等主流 Web 框架
  • 高度灵活的配置项,可轻松搭配出精美的图表
  • 详细的文档和示例,帮助开发者更快的上手项目
  • 多达 400 地图,为地理数据可视化提供强有力的支持

✨ 安装

代码语言:javascript复制
1pip install pyecharts

注意:pyecharts 共有两个版本,v0.5.X 和 V1.0.X 间完全不兼容,且v0.5.X版本作者已经不维护了,请使用V1.0.X

示例数据

pyecharts 给我们提供了示例数据,后面的图表示例的数据均来自 Faker 类,Faker 类的定义如下:

代码语言:javascript复制
 1class Faker:
 2    clothes = ["衬衫", "毛衣", "领带", "裤子", "风衣", "高跟鞋", "袜子"]
 3    drinks = ["可乐", "雪碧", "橙汁", "绿茶", "奶茶", "百威", "青岛"]
 4    phones = ["小米", "三星", "华为", "苹果", "魅族", "VIVO", "OPPO"]
 5    fruits = ["草莓", "芒果", "葡萄", "雪梨", "西瓜", "柠檬", "车厘子"]
 6    animal = ["河马", "蟒蛇", "老虎", "大象", "兔子", "熊猫", "狮子"]
 7    cars = ["宝马", "法拉利", "奔驰", "奥迪", "大众", "丰田", "特斯拉"]
 8    dogs = ["哈士奇", "萨摩耶", "泰迪", "金毛", "牧羊犬", "吉娃娃", "柯基"]
 9    week = ["周一", "周二", "周三", "周四", "周五", "周六", "周日"]
10    week_en = "Saturday Friday Thursday Wednesday Tuesday Monday Sunday".split()
11    clock = (
12        "12a 1a 2a 3a 4a 5a 6a 7a 8a 9a 10a 11a 12p "
13        "1p 2p 3p 4p 5p 6p 7p 8p 9p 10p 11p".split()
14    )
15    visual_color = [
16        "#313695",
17        "#4575b4",
18        "#74add1",
19        "#abd9e9",
20        "#e0f3f8",
21        "#ffffbf",
22        "#fee090",
23        "#fdae61",
24        "#f46d43",
25        "#d73027",
26        "#a50026",
27    ]
28    months = ["{}月".format(i) for i in range(1, 13)]
29    provinces = ["广东", "北京", "上海", "江西", "湖南", "浙江", "江苏"]
30    guangdong_city = ["汕头市", "汕尾市", "揭阳市", "阳江市", "肇庆市", "广州市", "惠州市"]
31    country = [
32        "China",
33        "Canada",
34        "Brazil",
35        "Russia",
36        "United States",
37        "Africa",
38        "Germany",
39    ]
40    days_attrs = ["{}天".format(i) for i in range(30)]
41    days_values = [random.randint(1, 30) for _ in range(30)]
42
43    def choose(self) -> list:
44        return random.choice(
45            [
46                self.clothes,
47                self.drinks,
48                self.phones,
49                self.fruits,
50                self.animal,
51                self.dogs,
52                self.week,
53            ]
54        )
55
56    @staticmethod
57    def values(start: int = 20, end: int = 150) -> list:
58        return [random.randint(start, end) for _ in range(7)]
59
60    @staticmethod
61    def rand_color():
62        return random.choice(
63            [
64                "#c23531",
65                "#2f4554",
66                "#61a0a8",
67                "#d48265",
68                "#749f83",
69                "#ca8622",
70                "#bda29a",
71                "#6e7074",
72                "#546570",
73                "#c4ccd3",
74                "#f05b72",
75                "#444693",
76                "#726930",
77                "#b2d235",
78                "#6d8346",
79                "#ac6767",
80                "#1d953f",
81                "#6950a1",
82            ]
83        )

常用的图表类型

Bar:柱状图/条形图

柱状图对应的模块是 Bar 除此之外可以设置全局配置和系列配置项。配置项都是基于 options 示例代码:

代码语言:javascript复制
 1# coding: utf-8
 2from example.commons import Faker
 3from pyecharts import options as opts
 4from pyecharts.charts import Bar
 5
 6def bar_base():
 7
 8    bar = Bar(init_opts=opts.InitOpts(page_title="bar页面"))  # 设置html页面标题
 9    # bar.add_xaxis(["衬衫", "羊毛衫", "雪纺衫", "裤子", "高跟鞋", "袜子"])  # 设置x轴的参数
10
11    bar.add_xaxis(Faker.choose())
12    bar.add_yaxis("A", Faker.values())
13    bar.add_yaxis("B", Faker.values())
14
15    # 设置全局配置项,可选
16    bar.set_global_opts(opts.TitleOpts(title="主标题", subtitle="副标题"))
17    # render 会生成本地 HTML 文件,默认会在当前目录生成 render.html 文件
18    bar.render("bar.html")  # 也可以自己指定文件名
19
20if __name__ == "__main__":
21    bar_base()

运行代码后会在当前目录生成一个 ”bar.html“ 的文件,我们在浏览器中打开它。效果图如下:

bar.html

生成的页面支持-点击取消显示某 Series

只显示A

除了上述的使用方法之外,pyecharts 所有方法均支持链式调用!

翻转XY轴

代码如下:

代码语言:javascript复制
 1def bar_reversal_axis() -> Bar:
 2
 3    # pyecharts 所有方法均支持链式调用。
 4    c = (
 5        Bar(init_opts=opts.InitOpts(page_title="bar页面"))
 6        .add_xaxis(Faker.choose())
 7        .add_yaxis("商家A", Faker.values())
 8        .add_yaxis("商家B", Faker.values())
 9        .reversal_axis()
10        .set_global_opts(toolbox_opts=opts.ToolboxOpts())  # 设置工具箱配置项
11        .set_series_opts(label_opts=opts.LabelOpts(position="right"))  # 系列配置项
12        .set_global_opts(title_opts=opts.TitleOpts(title="Bar-翻转 XY 轴"))  # 全局配置项
13    )
14    return c
15
16
17if __name__ == "__main__":
18    bar_reversal_axis().render("bar.html")

效果图如下:

翻转 XY 轴

部分堆叠数据

同个类目轴上系列配置相同的 stack 值可以堆叠放置

例如堆叠放置A,B的代码如下:

代码语言:javascript复制
 1def bar_stack1() -> Bar:
 2    c = (
 3        Bar()
 4        .add_xaxis(Faker.choose())
 5
 6        # 数据堆叠,同个类目轴上系列配置相同的 stack 值可以堆叠放置。
 7        # stack: Optional[str] = None,
 8        .add_yaxis("A", Faker.values(), stack="stack1")
 9        .add_yaxis("B", Faker.values(), stack="stack1")
10        .add_yaxis("C", Faker.values())
11        .set_series_opts(label_opts=opts.LabelOpts(is_show=False))
12        .set_global_opts(title_opts=opts.TitleOpts(title="Bar-堆叠数据(部分)"))
13    )
14    return c

部分堆叠数据

区域缩放配置项

代码语言:javascript复制
 1def bar_datazoom_slider() -> Bar:
 2    c = (
 3        Bar(init_opts=opts.InitOpts(page_title="bar页面"))
 4        .add_xaxis(Faker.days_attrs)
 5        .add_yaxis("商家A", Faker.days_values)
 6        .set_global_opts(
 7            title_opts=opts.TitleOpts(title="Bar-DataZoom(slider-水平)"),
 8            datazoom_opts=[opts.DataZoomOpts(type_="slider",)]
 9        )
10    )
11    return c

区域缩放配置项的设置方法在 DataZoomOpts 类中,我们可以点进去查看源码:

源码

其中,主要用到的参数含义如下:

代码语言:javascript复制
1 type_: str = "slider",  # 组件类型,可选 "slider", "inside"
2 # 拖动时,是否实时更新系列的视图。如果设置为 false,则只在拖拽结束的时候更新。
3 is_realtime: bool = True,
4
5 # 布局方式是横还是竖。可选值为:'horizontal', 'vertical'
6orient: str = "horizontal",

知道参数的含义后我们可以来试试效果

比如我们要将区域缩放布局改为竖,将 orient 定义为 vertical 即可,代码就不展示,可以自己动手试试!

HeatMap:热力图

热力图主要通过颜色去表现数值的大小,必须要配合 visualMap 组件使用。 直角坐标系上必须要使用两个类目轴。

热力图使用的方法函数是 add_yaxis,下面是函数的用法说明:

代码语言:javascript复制
 1def add_yaxis(
 2    # 系列名称,用于 tooltip 的显示,legend 的图例筛选。
 3    series_name: str,
 4
 5    # Y 坐标轴数据
 6    yaxis_data: Sequence,
 7
 8    # 系列数据项
 9    value: Sequence,
10
11    # 是否选中图例
12    is_selected: bool = True,
13
14    # 使用的 x 轴的 index,在单个图表实例中存在多个 x 轴的时候有用。
15    xaxis_index: Optional[Numeric] = None,
16
17    # 使用的 y 轴的 index,在单个图表实例中存在多个 y 轴的时候有用。
18    yaxis_index: Optional[Numeric] = None,
19
20    # 标签配置项,参考 `series_options.LabelOpts`
21    label_opts: Union[opts.LabelOpts, dict] = opts.LabelOpts(),
22
23    # 标记点配置项,参考 `series_options.MarkPointOpts`
24    markpoint_opts: Union[opts.MarkPointOpts, dict, None] = None,
25
26    # 标记线配置项,参考 `series_options.MarkLineOpts`
27    markline_opts: Union[opts.MarkLineOpts, dict, None] = None,
28
29    # 提示框组件配置项,参考 `series_options.TooltipOpts`
30    tooltip_opts: Union[opts.TooltipOpts, dict, None] = None,
31
32    # 图元样式配置项,参考 `series_options.ItemStyleOpts`
33    itemstyle_opts: Union[opts.ItemStyleOpts, dict, None] = None,
34)
35

其中series_name, yaxis_data, value 是三个必传参数 示例代码如下:

代码语言:javascript复制
 1import random
 2from example.commons import Faker
 3from pyecharts import options as opts
 4from pyecharts.charts import HeatMap
 5
 6
 7def heatmap_base() -> HeatMap:
 8    value = [[i, j, random.randint(0, 50)] for i in range(24) for j in range(7)]
 9    c = (
10        HeatMap()
11        .add_xaxis(Faker.clock)
12        .add_yaxis("series", Faker.week, value)
13        .set_global_opts(title_opts=opts.TitleOpts(title="HeatMap-基本示例"),
14                         visualmap_opts=opts.VisualMapOpts(), )
15    )
16
17    return c
18
19
20if __name__ == "__main__":
21    heatmap_base().render("heatMap.html")

WordCloud:词云图

词云图用的的方法函数是 add,使用方法如下:

代码语言:javascript复制
 1def add(
 2    # 系列名称,用于 tooltip 的显示,legend 的图例筛选。
 3    series_name: str,
 4
 5    # 系列数据项,[(word1, count1), (word2, count2)]
 6    data_pair: Sequence,
 7
 8    # 词云图轮廓,有 'circle', 'cardioid', 'diamond', 'triangle-forward', 'triangle', 'pentagon', 'star' 可选
 9    shape: str = "circle",
10
11    # 单词间隔
12    word_gap: Numeric = 20,
13
14    # 单词字体大小范围
15    word_size_range=None,
16
17    # 旋转单词角度
18    rotate_step: Numeric = 45,
19
20    # 提示框组件配置项,参考 `series_options.TooltipOpts`
21    tooltip_opts: Union[opts.TooltipOpts, dict, None] = None,
22)
23

其中series_name, data_pair, shape 是三个必传参数 示例代码如下:

代码语言:javascript复制
 1from pyecharts.charts import WordCloud
 2from pyecharts import options as opts
 3
 4words = [
 5    ("火箭", 10000),
 6    ("勇士库里", 8888),
 7    ("在你写这个教程之前,我已经会用了", 6181),
 8    ("哈登", 6386),
 9    ("金州拉文", 5055),
10    ("杜兰特", 6467),
11    ("戳眼", 2244),
12    ("NBA", 1868),
13    ("季后赛", 1484),
14    ("约老师", 1112),
15    ("利拉德", 865),
16    ("双卡双待", 847),
17    ("字母歌MVP", 5582),
18    ("卡哇伊", 555),
19    ("猛龙", 550),
20    ("大帝", 462),
21    ("西蒙斯不投三分", 366),
22    ("JB", 360),
23    ("科尔垃圾", 282),
24    ("格林公式", 273),
25    ("欧文", 2650),
26]
27
28
29def wordcloud_base() -> WordCloud:
30    c = (
31        WordCloud()
32        .add("", words, word_size_range=[20, 50], shape="diamond", word_gap=10)
33        .set_global_opts(title_opts=opts.TitleOpts(title="WordCloud-shape-diamond"))
34    )
35    return c
36
37
38if __name__ == "__main__":
39    wordcloud_base().render("wordCloud.html")

效果图如下:

NBA词云图

保存为图片

前面我们讲的几种图形生成方法,最后都保存成 html文件,pyecharts 还提供了保存为图片的方式

需要安装 snapshot_selenium,同时需要将浏览器驱动保存路径 cheromdriver.exe 加入到环境变量中

代码语言:javascript复制
1pip install snapshot_selenium

示例代码如下:

代码语言:javascript复制
 1# coding: utf-8
 2import random
 3
 4from pyecharts.charts import WordCloud
 5from pyecharts import options as opts
 6from snapshot_selenium import snapshot as driver
 7from pyecharts.render import make_snapshot
 8
 9words = [
10    ("火箭", 10000),
11    ("勇士库里", 8888),
12    ("在你写这个教程之前,我已经会用了", 6181),
13    ("哈登", 6386),
14    ("金州拉文", 5055),
15    ("杜兰特", 6467),
16    ("戳眼", 2244),
17    ("NBA", 1868),
18    ("季后赛", 1484),
19    ("约老师", 1112),
20    ("利拉德", 865),
21    ("双卡双待", 847),
22    ("字母歌MVP", 5582),
23    ("卡哇伊", 555),
24    ("猛龙", 550),
25    ("大帝", 462),
26    ("西蒙斯不投三分", 366),
27    ("JB", 360),
28    ("科尔垃圾", 282),
29    ("格林公式", 273),
30    ("欧文", 2650),
31]
32
33
34def wordcloud_base() -> WordCloud:
35    c = (
36        WordCloud()
37        .add("", words, word_size_range=[20, 50], shape="diamond", word_gap=10)
38        .set_global_opts(title_opts=opts.TitleOpts(title="WordCloud-shape-diamond"))
39    )
40    return c
41
42
43if __name__ == "__main__":
44    make_snapshot(driver, wordcloud_base().render(), "wordcloud.png")
45    # wordcloud_base().render("wordCloud.html")

最后会在当前目录生成一张 wordcloud.png 的图片

总结

1.根据自己想制作的图形,导入相关的包 2.进行图表的基础设置,创建图表对象 3.需要了解该图表对象下面的函数中参数的含义,及其使用方法 4.配置项主要是在 options中进行配置,有全局配置项和系列配置项,需要了解配置项下面对象含义使用方法 5.利用render()方法来报存图表

0 人点赞