统计上,分位数亦称分位点,是指将一个随机变量的概率分布范围分为几个等份的数值点,常用的有中位数(即二分位数)、四分位数、百分位数等。
在统计学中,p分位数的计算使用如下公式计算:
p分位数
R中使用quantile()计算分位数,其形式如下:
quantile(x, probs = seq(0, 1, 0.25), na.rm = FALSE, names = TRUE, type = 7, ...)
其中,参数x为数据对象;
probs给出相应的百分位数;
na.rm表示是否允许包含缺失值;
names为逻辑值,指示是否为结果给出命名属性;
type为分为数的算法,取值1~9,默认为7。
除了该函数之外,还可以使用fivenum函数或summary函数来求分位数。
举例说明
某班级20名学生的英语成绩为88, 78, 67, 69, 62, 100, 73, 45, 70, 60, 93, 97, 84, 82, 81, 73, 68, 76, 77, 92。计算其5分位数。
编写R程序如下:
x<-c(88, 78, 67, 69, 62, 100, 73, 45, 70, 60, 93, 97, 84, 82, 81, 73, 68, 76, 77, 92)quantile(x)quantile(x,names=FALSE) #去掉各值的名字fivenum(x) #使用此函数可以直接计算出五个数summary(x) #使用该函数可以计算出五数及均值
其运行结果如下图所示:
计算分位数的结果