R语言的各种统计分布函数，你应该了解的都在这！

正在学习R语言统计学的小伙伴，可能会被各种专有名词所困扰，小编为大家梳理了一下，话不多说，进入正题。

下图是截取自[《An Introduction to R》包含了R中所有的概率函数

R中的概率函数有统一的命名格式：即前缀分布函数名

正态分布的意义：理论上可以证明如果把许多小作用加起来看做一个变量,那么这个变量服从正态分布

以正态分布（函数norm）公式：

f(x) = {1over(sigmasqrt{2 pi}) }e^{-{(x - mu)^2 over (2 sigma^2)} }

其中

是均值，

sigma

是标准差

调用形式：

代码语言：javascript复制

norm(mean,sd)

代码语言：javascript复制

rnorm(n,mean=0,sd=1)

代码语言：javascript复制

dnorm(x,mean,sd)

参数解释：

画出正态分布概率密度函数的大致图形：

代码语言：javascript复制

x<-seq(-3,3,0.1)
# 注意：plot中的x,y要有相关关系才会形成函数图。
plot(x,dnorm(x))

代码语言：javascript复制

qnorm(p,mean,sd)

代码语言：javascript复制

# pnorm()默认的参数与dnorm()一样，都是标准正态分布，即平均数为0，标准差为1的正态分布
pnorm(0)
# [1] 0.5

3.sigma法则：

对于正态分布的x，x取值在(mean-3sd,mean 3sd)几乎就是极端值啦，因为pnorm(3)-pnorm(-3)=0.9973002，这个概率外的事情基本上不可能发生！

以上就是本期的主要内容，以正态分布为例子，我们学习了4个函数的使用。感兴趣的小伙伴总结一下其他的概率分布函数，举一反三，触类旁通，如果能加上一些生物信息学案例就更好了。

下面附上R语言内置数据包供大家练习使用。

后起之秀奔涌而至，欢迎大家在《生信技能树》的舞台分享自己的心得体会！

0 人点赞