1.期望:连续随机变量的加权平均值。如果下列积分有定义的话,即:
代码语言:javascript复制int|x|dF(x) < infty
定义X的期望(均值,一阶矩)为:
代码语言:javascript复制E(X) = mu = int{xdF(x)} = int{xp(x)dx}
对于离散随机变量为:
代码语言:javascript复制sum_x{xp(x)}
期望的性质:
- 线性运算:
math
E(aX b) = aE(x) b
- 加法法则, 设 xi x_i是随机变量,a_i是常量:
math
E(sum_ia_ix_i) = sum_ia_iE(x_i)
- 乘法法则,设 xi x_i是相互独立的随机变量:
math
E(prod^N_{i=1}X_i) = prod^N_{i=1}E(X_i)
2.众数(mode):设随机变量X有密度p(x),且存在 x0 x_0满足
math
x_0 = {arg max} p(x)
则称 x0 x_0为X的众数,刻画随机变量出现次数最多的位置
期望,中值和众数都被称为位置参数。 - 当随机变量为高斯分布(即正态分布)时,三者相等 3.中值(median):分布的中值可是为分布的中间,即在其上下的概率均为0.5:
代码语言:javascript复制Median(X):=x^*:P(X>=x*) = 0.5 = P(X<=x*)
4.分为函数(quantile):随机变量X的CDF为F,CDF的反函数为分位函数(quantile function)定义为(inf代表最小值):
代码语言:javascript复制F^-1(alpha) = inf{{x:F(x)>=alpha}}
其中 αϵ alphaepsilon[0,1].若F严格递增且连续,则 F−1(α) F^-1(alpha)为一个唯一确定的实数x,使得 F(x)=α F(x)=alpha. F−1 F^-1为增函数
中值/中位数: F−1(0.5) F^-1(0.5)
5.方差(variance): 当 E(Xk)<inf E(X^k)<inf, X的k阶矩定义为 E(xk) E(x^k) 若X有均值 μ mu,则其方差(二阶中心矩)为:
代码语言:javascript复制sigma^2 = V(X) = E(X-mu)^2 = int(x-mu)^2dF(x) = E(x^2) E(mu^2) - 2E(x)E(mu) = E(x^2) - mu^2
标准差(standard deviation)
代码语言:javascript复制sigma = sqrt{V(X)}
性质: - V(X)=E(x2)−μ2 V(X) = E(x^2) - mu^2 - 设a,b为常数, V(aX b)=a2V(x) V(aX b) = a^2V(x) - 如果 Xn X_n独立, an a_n为常数,则 V{∑Ni=1aiXi}=∑Ni=1a2iV(xi) V{sum^N_{i=1}a_iX_i} = sum^N_{i=1}a_i^2V(x_i).期望的加法不用互相独立,不独立随机变量考虑协方差
6.IQR(Interquantile Range)四分位矩: 25%到75%分位数之间的区间 - 中值比期望更鲁棒 - 四分位矩比方差更鲁棒