正态分布简介
正态分布
自然界中,许多连续型随机变量都呈现钟形分布,又叫正态分布。
正态分布的特性
标准正态分布几率表
标准正态分布
利用z表求标准正态分布几率与z值
利用z表求正态分布几率
检查数据是否为正态分布
利用直方图
只要出现钟形分布图形,即判定数据呈常态分布。
利用常态几率图
只要图形呈直线,即判定数据呈常态分布。
利用统计检定
- 卡方适配度检定(Chi-SquareGoodness-of-fitTest)
- K-S检定(Kolmogorov-Smirnovtest)
- A-D检定(Anderson-DarlingTest) (只要显着度 p-value > 0.05,即判定数据呈常态分布)
R的应用
小样本使用了Shapiro-Wilk检定。 大样本使用ks检定。
假设是:数据服从正态分布。 当p<0.05,拒绝假设,即数据不服从正态分布。
代码语言:javascript复制#generate two data sets
#first normal, second from a t-distribution, third form a uniform-distribution
words1 = rnorm(100); words2 = rt(100,df=3);words3=runif(100)
#have a look at densities
plot(density(words1))
plot(density(words2))
plot(density(words3))
#perform the test
#hypothesis: normal distribution, it's rejected when p<0.05
shapiro.test(words1)
shapiro.test(words2)
shapiro.test(words3)
ks.test(x,"norm")
#plot using a qqplot
qqnorm(words1);qqline(words1,col=2)
qqnorm(words2);qqline(words2,col=2)
qqnorm(words3);qqline(words3,col=3)