统计是推断-样本分布碎碎念

2024-08-21 13:37:38 浏览数 (3)

大家知道知道一一个样本是有一个分布的,但是不知道参数。那我们就用已经有的数据来算个数字,就说这个数字是我们想要分布的参数,当然可能不准,这个不准就是要检验。

再说一遍分布是什么意思?就是你把你采集到的数据在里面取一些特征,这个特征是指的数字特征,把它们按照顺序排开,看他总体的图形是什么样子的。你可以想象它上面有一个包络,在这篇文章或者说我们目前的书里面讲得最多的是,它就像一个钟型的曲线一样,是属于正态分布的。这篇文章下面的一些东西都是以正态分布展开的.

啥是分布,先不说三大分布,就说真实的汉语意思:(得到精确的分布就是统计的目的

就是散布的意思

比如这样

OK,我们从一堆东西,也就是样本中尽量提取出一些信息出来,这些信息统称为统计量,完全由样本所决定的量叫作统计量。

一些我们的样本里面的值,放在数轴上面,大多数时候呈现正态分布

是,全用上了

不是,有数不知道,没有用上所有的数据

均值就是可以和方差划等号

均值一定的时候,数据的聚散程度咋说?就是如果离均值近,差就小,就是一簇。

这个图还挺好的

样本方差是n-1/1,这里我还没有完全搞明白

上面是方差,下面说样本均值的分布。

想法是,我们现在现在先猜是属于正态分布的,但是两个参数不知道:

在统计中总体是未知的,是需要通过样本来推断的,所以用虚线和灰色来表示(总体的分布未知,总体的参数μ、σ^2也未知).

取一些数据算个均值X(有横),可以看到这个均值是和整体μ有偏差

嗷嗷

我这里插个大数定理,一个定理一个推论

其实这个就是说的独立同分布的中心极限定理

一些推导

或者直接记住这个,其实书上还有两个,不考,就不写

正态分布态广泛了,这些样本的整体可以构造好多统计量,这里有著名三大分布:

牛逼

就是一堆样本,我们给它²再相加,就是这样了。它指随机变量

伽马函数

图像是这样的

自由度的说法,马同学评论区有个:卡方分布的参数只有一个,调整该参数就可以调整卡方分布的形态。所以参数又称为自由度,相当于函数的自变量。

不管对不对,是不是看完就觉得很有道理。

反驳无效

一个正态一个卡方就是一个T分布

懂了?大概就是这样

两个卡方组一个F

图像如此

三大分布完事以后,继续讨论统计量的分布,上面说了均值,现在是方差。

最后补一个矩,矩就是期望的意思(大概)

1,原点矩,是随机变量到原点的距离(这里假设原点即为零点)。

2,中心矩则类似于方差,先要得出样本的期望即均值,然后计算出随机变量到样本均值的一种距离,与方差不同的是,这里所说的距离不再是平方就能构建出来的,而是k次方。

一,二阶中心距,也叫作方差,它告诉我们一个随机变量在它均值附近波动的大小,方差越大,波动性越大。方差也相当于机械运动中以重心为转轴的转动惯量。 二,三阶中心距告诉我们一个随机密度函数向左或向右偏斜的程度。 三,在均值不为零的情况下,原点距只有纯数学意义。

surface键盘真垃圾

比耶,两天学完数理统计

0 人点赞