大家好,我是俊欣,今天来和大家分享一下“如何用Pandas来绘制交互式的图形”,希望读者朋友们读了之后能够有所收获。
01
Plotly作为后端支持
我们可以使用第三方的可视化模块来做“Pandas”的后端支持,例如“Plotly”以及“Bokeh”等模块,进而便可以绘制出交互式的图形了,我们先来看一下“Plotly”作为后端的支持,
在我们导入所需要用到的模块之后,我们需要导入进需要用到的数据库,并且添加下面这行代码,以激活“Plotly”作为后端的支持
代码语言:javascript复制import pandas as pd
import numpy as np
from sklearn.datasets import fetch_openml
pd.options.plotting.backend = 'plotly'
X,y = fetch_openml("wine", version=1, as_frame=True, return_X_y=True)
data = pd.concat([X,y], axis=1)
data.head()
我们来将“Alcohol”和“Proline”两列做一个散点图,其中“Proline”列为X轴,“Alcohol”列为Y轴,代码如下
代码语言:javascript复制fig = data[['Alcohol', 'Proline']].plot.scatter(y='Alcohol', x='Proline')
fig.show()
出来的效果则如下图所示,
是不是和用“plotly”效果差不多?我们可以任意的放大特定的区域,以及下载高清的图像
当然我们也可以对散点图加上一个类别区分,酱紫来可视化不同类别之下的结果,代码如下
代码语言:javascript复制fig = data[['Hue', 'Proline', 'class']].plot.scatter(x='Hue', y='Proline', color='class', title='Proline and Hue by wine class')
fig.show()
出来的效果如下图所示
我们也可以绘制一些直方图,例如下面的代码,我们对“class”这一列进行“groupby”之后,然后计算出平均值,画出直方图
代码语言:javascript复制data[['Hue','class']].groupby(['class']).mean().plot.bar()
出来的效果如下图所示
02
Bokeh作为后端支持
好了,我们来看一下用“Bokeh”作为后端支持的“Pandas”可视化该如何来操作,我们也同样来绘制一个散点图,通过不同的类别来区分的,代码如下
代码语言:javascript复制pd.options.plotting.backend = 'pandas_bokeh'
import pandas_bokeh
from bokeh.io import output_notebook
from bokeh.plotting import figure, show
output_notebook()
p1 = data.plot_bokeh.scatter(x='Hue',
y='Proline',
category='class',
title='Proline and Hue by wine class',
show_figure=False)
show(p1)
绘制出来的结果如下,也是交互式的,
“Bokeh”模块当中有“plot_grid”方法可以用来绘制仪表盘,例如下面的代码绘制出了四个图形,分别是一张散点图,3张直方图,代码如下
代码语言:javascript复制output_notebook()
p1 = data.plot_bokeh.scatter(x='Hue',
y='Proline',
category='class',
title='Proline and Hue by wine class',
show_figure=False)
p2 = data[['Hue','class']].groupby(['class']).mean().plot.bar(title='Mean Hue per Class')
df_hue = pd.DataFrame({
'class_1': data[data['class'] == '1']['Hue'],
'class_2': data[data['class'] == '2']['Hue'],
'class_3': data[data['class'] == '3']['Hue']},
columns=['class_1', 'class_2', 'class_3'])
p3 = df_hue.plot_bokeh.hist(title='Distribution per Class: Hue')
df_proline = pd.DataFrame({
'class_1': data[data['class'] == '1']['Proline'],
'class_2': data[data['class'] == '2']['Proline'],
'class_3': data[data['class'] == '3']['Proline']},
columns=['class_1', 'class_2', 'class_3'])
p4 = df_proline.plot_bokeh.hist(title='Distribution per Class: Proline')
pandas_bokeh.plot_grid([[p1, p2],
[p3, p4]], plot_width=450)
而最后出来的结果如下图所示
今天的分享就到这里,希望大家看了有所收获!