箱线图,是指—种描述数据分布的统计图,是表述数据的第一四分位数、中位数、第三四分位数与异常值(离群值)的一种图形方法。它也可以粗略地看出数据是否具有对称性,分布的分散程度等信息,特别是可用于对多组样本的比较。
在matplitlib中,用boxplot() 函数函数绘制箱线图。
我们先绘制一个简单的箱线图,对比两组数据的分布:
代码语言:javascript复制import matplotlib as mpl
import matplotlib.pyplot as plt
import numpy as np
mpl.rcParams["font.sans-serif"] = ["FangSong"]
X1 = np.random.randn(200) 5
X2 = np.random.randn(100) 2
plt.boxplot([X1,X2],labels =[" A组","B组"])#labels表示分组
plt.ylabel("数据")
plt.title("箱线图示例",fontsize = 14,color="r")
plt.show()
可以显示平均值(图中三角形):
代码语言:javascript复制plt.boxplot([X1,X2], showmeans=True,labels =[" A组","B组"])
也可以线条显示平均值(图中虚线):
代码语言:javascript复制plt.boxplot([X1,X2],showmeans=True,meanline=True, labels =[" A组","B组"])
可以通过 sym参数 设置异常点的显示样式:
代码语言:javascript复制plt.boxplot([X1,X2],sym="r ", labels =[" A组","B组"])
其中,"r"表示红色;” “表示离群点符号,可以是"*","o","v"等等。
可以隐藏离群点:
代码语言:javascript复制plt.boxplot([X1,X2],showfliers = False, labels =[" A组","B组"])
可以给箱体“收腰”:
代码语言:javascript复制bplot = plt.boxplot([X1,X2],notch = True, labels =[" A组","B组"])
可以设置箱体的宽度(图略):
代码语言:javascript复制plt.boxplot([X1,X2],widths=[0.4,0.8], labels =[" A组","B组"])
可以改变whis参数(默认1.5)来改变箱须包含数据范围的大小:
代码语言:javascript复制plt.boxplot([X1,X2],whis=1.0, labels =[" A组","B组"])
whis<1.5,则更多的点显示为离群值,反之亦然。
可以设置箱体的颜色:
代码语言:javascript复制bplot = plt.boxplot([X1,X2],patch_artist=True,labels =[" A组","B组"])
colors =["pink", "lightgreen"]
for i, item in enumerate(bplot["boxes"]):
item.set_facecolor(colors[i])
以下是全部的参数,可根据需要组合使用:
代码语言:javascript复制boxplot(x, notch=None, sym=None, vert=None, whis=None, positions=None, widths=None, patch_artist=None, bootstrap=None, usermedians=None, conf_intervals=None, meanline=None, showmeans=None, showcaps=None, showbox=None, showfliers=None, boxprops=None, labels=None, flierprops=None, medianprops=None, meanprops=None, capprops=None, whiskerprops=None, manage_xticks=True, autorange=False, zorder=None, hold=None, data=None)