可以的,“Pandas”现在也可以绘制交互式的图形了,来看看怎么做的吧?

2021-07-19 14:19:30 浏览数 (2)

大家好,我是俊欣,今天来和大家分享一下“如何用Pandas来绘制交互式的图形”,希望读者朋友们读了之后能够有所收获。

01

Plotly作为后端支持

我们可以使用第三方的可视化模块来做“Pandas”的后端支持,例如“Plotly”以及“Bokeh”等模块,进而便可以绘制出交互式的图形了,我们先来看一下“Plotly”作为后端的支持,

在我们导入所需要用到的模块之后,我们需要导入进需要用到的数据库,并且添加下面这行代码,以激活“Plotly”作为后端的支持

代码语言:javascript复制
import pandas as pd
import numpy as np

from sklearn.datasets import fetch_openml

pd.options.plotting.backend = 'plotly'

X,y = fetch_openml("wine", version=1, as_frame=True, return_X_y=True)
data = pd.concat([X,y], axis=1)
data.head()

我们来将“Alcohol”和“Proline”两列做一个散点图,其中“Proline”列为X轴,“Alcohol”列为Y轴,代码如下

代码语言:javascript复制
fig = data[['Alcohol', 'Proline']].plot.scatter(y='Alcohol', x='Proline')
fig.show()

出来的效果则如下图所示,

是不是和用“plotly”效果差不多?我们可以任意的放大特定的区域,以及下载高清的图像

当然我们也可以对散点图加上一个类别区分,酱紫来可视化不同类别之下的结果,代码如下

代码语言:javascript复制
fig = data[['Hue', 'Proline', 'class']].plot.scatter(x='Hue', y='Proline', color='class', title='Proline and Hue by wine class')
fig.show()

出来的效果如下图所示

我们也可以绘制一些直方图,例如下面的代码,我们对“class”这一列进行“groupby”之后,然后计算出平均值,画出直方图

代码语言:javascript复制
data[['Hue','class']].groupby(['class']).mean().plot.bar()

出来的效果如下图所示

02

Bokeh作为后端支持

好了,我们来看一下用“Bokeh”作为后端支持的“Pandas”可视化该如何来操作,我们也同样来绘制一个散点图,通过不同的类别来区分的,代码如下

代码语言:javascript复制
pd.options.plotting.backend = 'pandas_bokeh'

import pandas_bokeh
from bokeh.io import output_notebook
from bokeh.plotting import figure, show

output_notebook()
p1 = data.plot_bokeh.scatter(x='Hue', 
                              y='Proline', 
                              category='class', 
                              title='Proline and Hue by wine class',
                              show_figure=False)
show(p1)

绘制出来的结果如下,也是交互式的,

“Bokeh”模块当中有“plot_grid”方法可以用来绘制仪表盘,例如下面的代码绘制出了四个图形,分别是一张散点图,3张直方图,代码如下

代码语言:javascript复制
output_notebook()

p1 = data.plot_bokeh.scatter(x='Hue', 
                              y='Proline', 
                              category='class', 
                              title='Proline and Hue by wine class',
                              show_figure=False)

p2 = data[['Hue','class']].groupby(['class']).mean().plot.bar(title='Mean Hue per Class')

df_hue = pd.DataFrame({
    'class_1': data[data['class'] == '1']['Hue'],
    'class_2': data[data['class'] == '2']['Hue'],
    'class_3': data[data['class'] == '3']['Hue']},
    columns=['class_1', 'class_2', 'class_3'])

p3 = df_hue.plot_bokeh.hist(title='Distribution per Class: Hue')

df_proline = pd.DataFrame({
    'class_1': data[data['class'] == '1']['Proline'],
    'class_2': data[data['class'] == '2']['Proline'],
    'class_3': data[data['class'] == '3']['Proline']},
    columns=['class_1', 'class_2', 'class_3'])

p4 = df_proline.plot_bokeh.hist(title='Distribution per Class: Proline')

pandas_bokeh.plot_grid([[p1, p2], 
                        [p3, p4]], plot_width=450)

而最后出来的结果如下图所示

今天的分享就到这里,希望大家看了有所收获!

0 人点赞