大家知道知道一一个样本是有一个分布的,但是不知道参数。那我们就用已经有的数据来算个数字,就说这个数字是我们想要分布的参数,当然可能不准,这个不准就是要检验。
再说一遍分布是什么意思?就是你把你采集到的数据在里面取一些特征,这个特征是指的数字特征,把它们按照顺序排开,看他总体的图形是什么样子的。你可以想象它上面有一个包络,在这篇文章或者说我们目前的书里面讲得最多的是,它就像一个钟型的曲线一样,是属于正态分布的。这篇文章下面的一些东西都是以正态分布展开的.
啥是分布,先不说三大分布,就说真实的汉语意思:(得到精确的分布就是统计的目的)
就是散布的意思
比如这样
OK,我们从一堆东西,也就是样本中尽量提取出一些信息出来,这些信息统称为统计量,完全由样本所决定的量叫作统计量。
一些我们的样本里面的值,放在数轴上面,大多数时候呈现正态分布
是,全用上了
不是,有数不知道,没有用上所有的数据
均值就是可以和方差划等号
均值一定的时候,数据的聚散程度咋说?就是如果离均值近,差就小,就是一簇。
这个图还挺好的
样本方差是n-1/1,这里我还没有完全搞明白
上面是方差,下面说样本均值的分布。
想法是,我们现在现在先猜是属于正态分布的,但是两个参数不知道:
在统计中总体是未知的,是需要通过样本来推断的,所以用虚线和灰色来表示(总体的分布未知,总体的参数μ、σ^2也未知).
取一些数据算个均值X(有横),可以看到这个均值是和整体μ有偏差
嗷嗷
我这里插个大数定理,一个定理一个推论
其实这个就是说的独立同分布的中心极限定理
一些推导
或者直接记住这个,其实书上还有两个,不考,就不写
正态分布态广泛了,这些样本的整体可以构造好多统计量,这里有著名三大分布:
牛逼
就是一堆样本,我们给它²再相加,就是这样了。它指随机变量
伽马函数
图像是这样的
自由度的说法,马同学评论区有个:卡方分布的参数只有一个,调整该参数就可以调整卡方分布的形态。所以参数又称为自由度,相当于函数的自变量。
不管对不对,是不是看完就觉得很有道理。
反驳无效
一个正态一个卡方就是一个T分布
懂了?大概就是这样
两个卡方组一个F
图像如此
三大分布完事以后,继续讨论统计量的分布,上面说了均值,现在是方差。
最后补一个矩,矩就是期望的意思(大概)
1,原点矩,是随机变量到原点的距离(这里假设原点即为零点)。
2,中心矩则类似于方差,先要得出样本的期望即均值,然后计算出随机变量到样本均值的一种距离,与方差不同的是,这里所说的距离不再是平方就能构建出来的,而是k次方。
一,二阶中心距,也叫作方差,它告诉我们一个随机变量在它均值附近波动的大小,方差越大,波动性越大。方差也相当于机械运动中以重心为转轴的转动惯量。 二,三阶中心距告诉我们一个随机密度函数向左或向右偏斜的程度。 三,在均值不为零的情况下,原点距只有纯数学意义。
surface键盘真垃圾
比耶,两天学完数理统计