原子事件:对于离散事件不可再分的事件,如掷骰子,掷出1,2,3,4,5,6的任意一种就是原子事件。离散事件的原子事件,我们可以用下面的表格来表示。
| S | K |
---|---|---|
1 | 原子事件a | 数值1 |
2 | 原子事件b | 数值2 |
3 | 原子事件c | 数值3 |
4 | 原子事件d | 数值4 |
5 | 原子事件e | 数值5 |
6 | 原子事件f | 数值6 |
由于对于数学来说,我们必须定量,所以我们需要给每一个原子事件一个数值,方便我们后续的计算,那么该数值用该事件在整体事件发生的可能性(possibility)来定义,该数值可以是任意值,我们用一个函数来表示
f(S)=K
通过输入一个事件S,通过函数f来计算出该事件对应数值的大小K。
对于一些包含事件(非原子事件),我们可以用对数值求和来表示
P(S) | (sum{K}) |
---|---|
{1,2} | 数值1 数值2 |
{1,2,3} | 数值1 数值2 数值3 |
{3,4} | 数值3 数值4 |
{2,4} | 数值2 数值4 |
这里的P(S)表示S集合的幂集(是指一个集合的所有子集(包括全集和空集)构成的集合族)。这样我们就能知道所有事件可能性的最大值,也就是所有事件的K值之和。
(max(sum{K})=sum_{s∈S}f(s))
同时我们也可以对数值K进行归一化
(K^*={Kover sum_{s∈S}f(s)}∈0,1)
这里的(K^*)就是概率值了
以上都是以离散事件为根基的,但是如果是一个连续的事件,如明天的温度,我们无法确定一个原子事件,因为温度是有21.5度,21.6度,...,它是一个实数值。在连续的事件中,我们只有一个个数值点,且该数值点是不能代表一个事件的,该点的数值也不能代表可能性。
R | S | K |
---|---|---|
... | 点a | 数值1 |
... | 点b | 数值2 |
... | 点c | 数值3 |
... | 点d | 数值4 |
... | ... | ... |
则该表格就失去了意义,我们可以重新建立一个表格
S | F δ~域 | (int{K}=P) |
---|---|---|
... | 1,2 | (int{数值1,数值2}) |
... | 1,3 | (int{数值1,数值3}) |
... | 3,4 | (int{数值3,数值4}) |
... | 1,2∪3,4 | (int{数值1,数值2} int{数值3,数值4}) |
... | ... | ... |
上表中的第二列是实数集的δ~域(比幂集更小的概念,幂集本身在实数中是无穷的,无法做归一化,但δ~域会排除无穷),第一列S就是事件,第三列就是该事件发生的概率P,因为是连续的事件,所以用积分来求和。
在离散事件中,我们是用f(S)=K来求得该事件的可能性,而不是概率。而在连续事件中,我们使用F(x)=事件(-∞,x]的可能性,其中x∈R,(-∞,x]∈δ~域,F(x)就是连续型随机变量分布函数,那么概率密度函数则为f(x)=F'(x)=K,这样我们就清楚了,连续型事件的可能性就是某些点的概率密度求和(此处可以参考概率论整理(二) 中的连续型随机变量的概率密度)。
我们在连续型事件的第一张表S中的点a、点b、点c、点d,它们只是只是对它们用实数来编号,但并不代表它们本身就是数,而是样本空间,当用实数来编号的时候会有一个函数X(S)=R。
概率空间会用三个符号{Ω,F,P}来表示,其中Ω就是样本空间,即第一张表中的S;F是样本空间中生成的δ~域,它才是真正的事件,而样本空间中的单个样本并不是事件;P是F中所有元素的一个权重值,在F中的每一个元素在P中都会有一个值与其对应。由于Ω不一定是数,通过X(S)=R来转化为概率空间{R,F,P},这样我们就可以通过实数的计算来进行样本空间的分析。