概率论框架再定义

2024-06-28 09:07:50 浏览数 (2)

原子事件:对于离散事件不可再分的事件,如掷骰子,掷出1,2,3,4,5,6的任意一种就是原子事件。离散事件的原子事件,我们可以用下面的表格来表示。

S

K

1

原子事件a

数值1

2

原子事件b

数值2

3

原子事件c

数值3

4

原子事件d

数值4

5

原子事件e

数值5

6

原子事件f

数值6

由于对于数学来说,我们必须定量,所以我们需要给每一个原子事件一个数值,方便我们后续的计算,那么该数值用该事件在整体事件发生的可能性(possibility)来定义,该数值可以是任意值,我们用一个函数来表示

f(S)=K

通过输入一个事件S,通过函数f来计算出该事件对应数值的大小K。

对于一些包含事件(非原子事件),我们可以用对数值求和来表示

P(S)

(sum{K})

{1,2}

数值1 数值2

{1,2,3}

数值1 数值2 数值3

{3,4}

数值3 数值4

{2,4}

数值2 数值4

这里的P(S)表示S集合的幂集(是指一个集合的所有子集(包括全集和空集)构成的集合族)。这样我们就能知道所有事件可能性的最大值,也就是所有事件的K值之和。

(max(sum{K})=sum_{s∈S}f(s))

同时我们也可以对数值K进行归一化

(K^*={Kover sum_{s∈S}f(s)}∈0,1)

这里的(K^*)就是概率值了

以上都是以离散事件为根基的,但是如果是一个连续的事件,如明天的温度,我们无法确定一个原子事件,因为温度是有21.5度,21.6度,...,它是一个实数值。在连续的事件中,我们只有一个个数值点,且该数值点是不能代表一个事件的,该点的数值也不能代表可能性。

R

S

K

...

点a

数值1

...

点b

数值2

...

点c

数值3

...

点d

数值4

...

...

...

则该表格就失去了意义,我们可以重新建立一个表格

S

F δ~域

(int{K}=P)

...

1,2

(int{数值1,数值2})

...

1,3

(int{数值1,数值3})

...

3,4

(int{数值3,数值4})

...

1,2∪3,4

(int{数值1,数值2} int{数值3,数值4})

...

...

...

上表中的第二列是实数集的δ~域(比幂集更小的概念,幂集本身在实数中是无穷的,无法做归一化,但δ~域会排除无穷),第一列S就是事件,第三列就是该事件发生的概率P,因为是连续的事件,所以用积分来求和。

在离散事件中,我们是用f(S)=K来求得该事件的可能性,而不是概率。而在连续事件中,我们使用F(x)=事件(-∞,x]的可能性,其中x∈R,(-∞,x]∈δ~域,F(x)就是连续型随机变量分布函数,那么概率密度函数则为f(x)=F'(x)=K,这样我们就清楚了,连续型事件的可能性就是某些点的概率密度求和(此处可以参考概率论整理(二) 中的连续型随机变量的概率密度)。

我们在连续型事件的第一张表S中的点a、点b、点c、点d,它们只是只是对它们用实数来编号,但并不代表它们本身就是数,而是样本空间,当用实数来编号的时候会有一个函数X(S)=R。

概率空间会用三个符号{Ω,F,P}来表示,其中Ω就是样本空间,即第一张表中的S;F是样本空间中生成的δ~域,它才是真正的事件,而样本空间中的单个样本并不是事件;P是F中所有元素的一个权重值,在F中的每一个元素在P中都会有一个值与其对应。由于Ω不一定是数,通过X(S)=R来转化为概率空间{R,F,P},这样我们就可以通过实数的计算来进行样本空间的分析。

0 人点赞