R语言的各种统计分布函数,你应该了解的都在这!

2021-01-18 14:54:14 浏览数 (1)

正在学习R语言统计学的小伙伴,可能会被各种专有名词所困扰,小编为大家梳理了一下,话不多说,进入正题。

下图是截取自[《An Introduction to R》包含了R中所有的概率函数

1.简单介绍:

R中的概率函数有统一的命名格式:即前缀 分布函数名

  • d 表示密度函数(density);
  • p 表示分布函数;
  • q 表示分位数函数,能够返回特定分布的分位数(quantile);
  • r 表示随机函数,生成特定分布的随机数。

2.举个例子

正态分布的意义:理论上可以证明如果把许多小作用加起来看做一个变量,那么这个变量服从正态分布

以正态分布(函数norm)公式:

f(x) = {1over(sigmasqrt{2 pi}) }e^{-{(x - mu)^2 over (2 sigma^2)} }

其中

mu

是均值,

sigma

是标准差

调用形式:

代码语言:javascript复制
norm(mean,sd)
随机分布函数调用:
代码语言:javascript复制
rnorm(n,mean=0,sd=1)
  • 参数解释:
    • mean 均值
    • sd 标准差
    • 后两个参数如果不填则默认为0,1。
密度函数调用
代码语言:javascript复制
dnorm(x,mean,sd)

参数解释:

  • mean 均值
  • 后两个参数如果不填则默认为0,1。

画出正态分布概率密度函数的大致图形:

代码语言:javascript复制
x<-seq(-3,3,0.1)
# 注意:plot中的x,y要有相关关系才会形成函数图。
plot(x,dnorm(x))
分位数函数调用形式:
代码语言:javascript复制
qnorm(p,mean,sd)
  • 参数解释:
    • p为概率值
    • mean 均值
    • sd 标准差
    • 后两个参数如果不填则默认为0,1。
    • 如qnorm(0.05)=-1.644854,即x<=这个数的累计概率(-1.644854)小于0.05
分布函数的调用:
代码语言:javascript复制
# pnorm()默认的参数与dnorm()一样,都是标准正态分布,即平均数为0,标准差为1的正态分布
pnorm(0)
# [1] 0.5

3.sigma法则:

对于正态分布的x,x取值在(mean-3sd,mean 3sd)几乎就是极端值啦,因为pnorm(3)-pnorm(-3)=0.9973002,这个概率外的事情基本上不可能发生!

以上就是本期的主要内容,以正态分布为例子,我们学习了4个函数的使用。感兴趣的小伙伴总结一下其他的概率分布函数,举一反三,触类旁通,如果能加上一些生物信息学案例就更好了。

下面附上R语言内置数据包供大家练习使用 。

后起之秀奔涌而至,欢迎大家在《生信技能树》的舞台分享自己的心得体会!

0 人点赞