上一节笔记:随机过程(8)——更新过程在排队论的两个应用,PASTA,连续时间马尔科夫链引入
————————————————————————————————————
大家好!告别2020年之后,希望2021年大家能够顺心顺意,似乎暴露了文章写作的时间哦……
这一节我们会继续介绍连续时间马尔科夫链,包括它的一些比较形象化的描述,它的极限性质等,就和我们之前讨论离散状态马尔科夫链一样。事实上到后面我们也会继续接触各式各样的排队论模型,连续时间马尔科夫链在排队论中的应用同样十分广泛。
那么我们开始吧。
目录
- 连续时间马尔科夫链的转移速率应用
- 转移速率的形象化描述
- 爆炸现象
- 连续时间马尔科夫链的平稳分布
连续时间马尔科夫链的转移速率应用
首先声明一下,这里的转移速率(transition rate)的概念,其实就是上一节所提到的跳跃速率(jump rate),很多时候两个概念会混着用。
在上一节的最后我们给大家展示了转移速率和C-K方程的联系,合理利用它们俩可以帮助我们求解连续时间马尔科夫链的转移概率矩阵。考虑到马尔科夫链中,转移概率矩阵是一个核心工具,因此在连续时间马尔科夫链中,刻画出转移速率矩阵就成为了一个很重要的任务。这一部分我们就简单的举两个例子,给大家加深一些印象。
Problem 1: 考虑一个速率为
的泊松过程,证明
。
这个其实就是上一节的例子(Problem 3)。这里就不多费笔墨去说这一件事了。
Problem 2: 考虑排队论中的
模型,也即顾客到达服从一个速率为
的泊松过程,而服务时间服从一个速率为
的泊松过程,二者相互独立。一共有
个服务器,那么在这个场景下,刻画整个系统中的人数,其对应的转移速率为
,
。
如果到达的速率服从泊松过程的话,
其实就是Problem 1的复用,没有太多需要强调的地方。但是
对应的是什么情况呢?自然就是系统中有人离开的情况了。在这个时候,我们将系统中的人数分情况做讨论,就可以看出一些端倪。
首先如果
,事实上对应的是服务器未满载的情况。那么这个时候,可以想像
个服务器中,只有
个在服务,那么“离开”这一件事情要等待的时间,其实就是所有的正在服务的人,要等待的最小值。如果说每一个的时间是
的话,那么这个“离开”发生所需要的等待时间就是
,自然也是服从一个指数分布(这个是一个概率论的结论,后面单独说)。而这个指数分布的参数对应的就是
。那么既然等待时间是指数分布,整个过程就是一个泊松过程,所以复用一下Problem 1的结论就可以了。
同样的思路,如果
,那么服务器满载,所以
个都会服务,那么对应的参数就是
。
最后我们来说一下这个指数分布的概率论中的结论。
Lemma 1: 若
,那么
。
这可以直接利用分布函数来推得,是概率论的内容。如果这个不会的话,可能就需要回去复习一下概率论中的最小值分布了。
转移速率的形象化描述
因为脱去了“步数”这么一个具体的概念,所以很多时候会导致连续时间马尔科夫链不是特别好想。这里我们提供了三个常见的对于转移速率的形象化描述。
首先来看第一种描述。
Description 1: 考虑平面上的点,那么假如说一开始,一个跳蚤在点
,对每一个
,假设经过
的时间,跳蚤就会跳到点
。但跳蚤最终跳到哪里,取决于到哪儿所需要的时间最短,那么可以说明的是,跳蚤所在的点对应的转移概率
满足
。
画一张图来表示一下这个过程。
第一次,因为跳到
要等的时间更短,所以就先跳到了
。
对这个问题如何建模呢?其实我们只需要关心怎么求
。这里就涉及到跳跃的统计问题。诚然,从
到
的跳跃会有很多种可能,因此我们先考虑一步到
的可能性。那么这样的话,实质上可以建模为
这表示在
的时间内,到达
所需要等待的时间最短,其它的等待时间都不在
以内。
那么自然的,对它求极限和除法,就会有
那么两步及以上的情况呢?这里要说明的是它本身是一个
的高阶小量,细节上不太好说,这里提供一个思考视角。注意到两步其实就是“一步又一步”的含义。前后的独立性带来的概率的乘积,会将两个
的线性项乘起来,这就变成二阶,也就是高阶无穷小了。
因此我们可以看出,这个描述的其实就是一个转移速率矩阵为
的连续时间马尔科夫链。
Description 2: 考虑一个跳蚤一开始在点
,那么从其离开
需要等待
的时间,其中
。其跳到
的概率为
。此描述对应的随机过程与Description 1相同。
如果说它和Description 1相同,其实一开始不容易让人信服,毕竟,第一个可以看出,跳跃到具体哪一个点是受所有的点制约的。但是这一个似乎就把这个”相互关系“给剥离掉了。这是什么情况呢?事实上这也是一个概率论的性质,这个性质要说明起来还是有点难度,我们仔细看一下。
Lemma 2: Exponential Race 设
,相互独立。
,那么有
,并且
相互独立。
这里相对有些反人类的地方就是
相互独立,简单来说,“第一个到达的点的时间”和“第一个到达的点是谁”没有联系。这在这两个随机变量都和
有关的情况下就显得更加的反直觉了。
要说明这一点,其实也就是概率论的定义。注意到
注意到分离变量,这就完成了证明。
这个命题可以说明的一点是,用Description 2来描述这个过程,和用Description 1来描述是一模一样的。这只是同一个结论用了两段不同的话语去说而已。
事实上,还有一个Description 3,可以理解为它是Description 2的一个标准化。
Description 3: 考虑一个跳蚤一开始在点
,那么从其离开
需要等待
的时间,其中
,并且
与之前的定义一样。其跳到
的概率为
。并且
。此描述对应的随机过程与Description 1相同。
一般来说,我们会把它称为是Description 2的一个“归一化”。直观来看,相当于我们把所有的
都统一了起来,统一为一个“离开时间”(但是注意,这个时候是有可能这个点不会离开的,因此叫离开时间可能并不准确)。
至于为什么说这个描述也是正确的,就需要参考上一节的Problem 2。在Problem 2我们描述了一个随机过程
。其中
就是一个泊松过程,而
是一个离散马尔科夫链,转移概率为
。
在上一节的Problem 2-2,我们也给出了这个随机过程的转移概率
。事实上,如果我们把这些数据代入公式计算,会发现转移速率矩阵和Description 1是相同的,因此它确实是一个合理的描述连续时间马尔科夫链的方案。至于这个验证过程,我们就交给读者了。
Description 3还有一个优势在随机模拟上。在计算统计中经常会出现需要模拟一条随机过程的情况(比方说MCMC),而这个方案相对来说是最好实现的。
最后总结一下,因为我们相当于把一条连续时间马尔科夫链给建模成了一条泊松过程,所以一切之前与泊松过程有关的性质,结论,都可以应用到这里的连续时间马尔科夫链上。这也是为什么之后介绍它与离散马尔科夫链的联系的时候,我们很多时候可能只会寥寥几笔带过,因为所需要的工具,之前都铺垫的差不多了。
爆炸现象
这里的爆炸(explosion)现象自然不可能是物理中的原子弹爆炸,也不可能是化学中的活泼金属遇水爆炸,而是一种特殊的状态转移现象。即
有限时间内,状态转移发生了无限次。
如果这种现象发生,就说明所有的状态转移,都发生在有限的一段时间内。这在随机模拟中自然是一个不可接受的现象,同样这也不会在离散马尔科夫链中发生,因为在离散情况下根本没有时间的概念。
我们来看一个具有爆炸现象的例子。
Problem 3: Pure Birth 考虑一个生命链,也即
,其余均为0。并假设从
开始。那么考虑
为跳转
次状态经过的时间,说明如果
,那么会发生爆炸现象。
直观来看,容易猜出
应该是一个合理的答案,因为这个时候,可以看出转移速率呈现指数上升的趋势。因此可以想像,到最后,跳转的速度就越来越快,一直到最后可能就会一发不可收拾。
首先是
的情况,这个时候,我们来考察
,注意到
数分中我们学过,这是一个p-级数。简单来说,
的时候,这个级数是收敛的。那么高等概率论中有说过
简单来说,这个时候就出现了这种“几乎处处”极限时间为有限的情况,这也就是所谓的爆炸现象。
多说几句,如果
,其实也有一个有意思的事情,就是
。但是要注意,这个时候并没有
相关的结论。那么这里如果要看
的情况,一个粗略的办法是看它的波动,也就是方差。容易发现
是一个有限的数,所以利用切比雪夫(Chebyshev)不等式,我们有
那么再根据
,说明
比一个无穷要小的概率趋于0,那自然就说明了
。这也说明了,
的情况下,尽管移动的速率仍然会越来越快,但是因为不会有指数上升的趋势,所以依然可以使用随机模拟来模拟这个过程,不会有爆炸现象的发生。
好的,到此为止,我们就说完了对于连续时间马尔科夫链的基本刻画。在这之后,我们会利用这些性质,来推广一些离散马尔科夫链中已经涉及到的定理等内容。
连续时间马尔科夫链的平稳分布
很自然,这一节对标的就是离散马尔科夫链的对应内容。强调一遍,我们需要多次的与之前的离散马尔科夫链模型进行对比,所以如果对相关术语感到陌生,建议对之前的内容再多阅读阅读
随机过程(1)——引入,有限状态马尔科夫链,状态转移,常返与瞬时状态
随机过程(2)——极限状态的平稳分布与周期(上),一些特殊的马尔科夫链
随机过程(3)——无限状态的平稳测度,返回时间,访问频率:几个定理的证明
随机过程(4)——返回时间,访问频率定理应用,离出分布,离出时间
回顾一下离散马尔科夫链的平稳分布定义,我们要求马尔科夫链是不可约的,非周期的,常返的。在连续时间马尔科夫链中,首先不再有周期的概念,其次其余的概念肯定也不能直接套用。所以这里需要对他们做一个重新的刻画。
Definition 1: Irreducible 对于连续时间马尔科夫链
而言,如果对任意的
,
到
都能在有限步内完成,也即
,使得
,那么称其不可约。
如果要说明为什么这个不可约的定义是合理的,只需要说明
即可。这个其实也不是特别困难,和离散马尔科夫链的思考过程类似,考虑一种状态转移的情况,首先将
转换为
,所以我们取一个很小的
,对区间分拆,就有
这个转移的过程相当于说,一开始从
到
的这中间经过的各个步骤,每一步都经过了时间
,然后到了最后的
的时候停留了一段时间(时间
)。那么注意到
(这是因为等待这个过程本身是一个泊松过程,所以这个概率就是一个指数分布的概率),所以自然的根据条件就可以得到这个结论。
这个区间分拆大概可以用图表示为这么一个意思。
下面我们来给定平稳分布的定义。
Definition 2: Stationary Distribution 如果满足
,那么称
是一个平稳分布。
自然地,我们也希望了解为什么
可以对应上离散马尔科夫链的平稳分布的定义。回顾一下,之前我们说过
是一个条件,那么两边求导就会有
。这是一个思路,总结一下就是
因为我们之前有提过
,当然这是需要假设
的情况下。
这是一个引发我们思考的思路,但很显然不是证明,因为还差另外一个方向。如果
,那么能不能推导出
这样的结论呢?其实也是可以的,因为我们有
那么这就说明了
,因为
。所以可以看出,两个方向的证明其实都利用了上一节提到的Kolmogorov方程。
现在我们再回头看一下
所想表达的意思。其实利用矩阵乘法,也不难发现它就是这么一个意思
当然第二个等号是因为我们之前有定义
,同样是在上一节我们定义跳跃速率的时候做的人工补充。
抽象一下,
就是从
出发,到其它各点的“加权速率和”,而
就是除
以外的点到达
的“加权速率和”。因此这里的“平稳”,就是“到达的速率”和“出去的速率”相同的意思。当然这个话术其实我们在离散马尔科夫链中就已经用过了,当时是使用转移概率矩阵来描述的。
一个比较好的对比技巧是,将这里的
和之前的
联系起来,比方说离散情况,其实平稳分布的定义就是
,这就可以和这里的公式对应上。
有了平稳分布之后,自然也可以很好的定义细致平衡条件(detailed balanced condition)和逆马尔科夫链(reversed Markov chain)。
Definition 3: Detailed Balanced Condition 如果
,那么称分布满足细致平衡条件。
类似的,满足细致平衡条件的分布肯定也是平稳分布,但是反过来不一定。这也是从离散马尔科夫链直接推导过来的结论。
Definition 4: Reversed Chain 定义
是原连续时间马尔科夫链的逆马尔科夫链。其中
从平稳分布出发。
这里的
其实是可以趋于无穷大的,因此这个定义并不代表这个随机变量只定义在区间
上。
对于它的转移速率相关的性质,也是和离散情况非常类似的。
Proposition 1 逆马尔科夫链的转移速率满足
。
可以看出,与离散的情况基本上相同。
要说明
是合理的,其实只需要说明
和离散情况一模一样的推导方式,我们直接可以得到
这里就不多解释了。
同样的,如果
服从细致平衡条件,那么会有
。
最后也是类比于离散情况,我们可以得到下面这样的结论。
Theorem 1: 设
是一条连续时间马尔科夫链,不可约,且存在平稳分布
,那么有
。
我们就不证明这个结论了。
Theorem 2: 在连续时间马尔科夫链中,有
同样,它们也是和离散时间马尔科夫链相对应的结论。细微的差别便在
这个系数上。
要说明这个结论,我们可以使用更新过程的方法,这是因为我们之前说过,
可以理解为是一个泊松过程,我们画一张图解释一下。
这里两个
之间的内容都是其他状态。简单来说,定义这里的奖赏
为“等待离开
的时间”。
因为连续时间马尔科夫链可以用泊松过程描述(Description 2),所以这里我们使用更新奖赏过程来进行证明,也就是说定义
为停留在状态
的时间,定义
为从一个
到下一个
所需要的时间,这样的话直接就会有
这就完成了证明。
对于第二个式子,可能情况稍微复杂一些。注意到
这其实就是一个期望和积分的交换顺序。有了这个之后,其实只需要注意到,因为我们的
,所以极限状态下,会有
。比较类似数分里,有限的部分带来的影响可以忽略不计一样。这里也是因为这个可以得到这个极限为
。当然了至于为什么同样可以得到
,其实还是更新奖赏过程的理论,可以参考第7节
随机过程(7)——更新奖赏过程:交替更新过程,生存与濒死时间,观察悖论
好的,我们来看几个例子吧。
Problem 4:
Queue with Balking 考虑一个排队论模型,理发店有
个理发师,顾客到来时间服从一个速率为
的泊松分布,而对于每一个顾客而言,有
的概率加入这个队伍,这里的
是在系统中的人数,不包括他自己。服务时间服从一个速率为
的泊松分布。刻画这个系统的平稳分布。
事实上有了连续时间马尔科夫链的工具,我们可以用它来解决一些排队论的问题,因为它也可以被理解为是一种泊松过程。
不难得到我们可以刻画出这样的转移速率矩阵。
这里要注意
是怎么来的,速率为
加上“加入概率为
",所以对应了一条速率为
的泊松过程。这一个对应泊松过程的稀疏变换,可以参考这一节
随机过程(6)——泊松过程三大变换,更新过程引入
这个转移速率其实可以利用细致平衡条件来求解,不难得到
当然要刻画它的平稳分布,在这个无限状态的情况下,我们就自然希望知道
是否是一个有限数,因为这决定了平稳分布的存在性和值。
虽然没办法再给出更细节的刻画,但有一个比较好分析的case就是
。这个情况下根据级数的比值判别法,可以看出和是收敛的,也就是平稳分布存在的意思。
Problem 5: 考虑一个天气转移的过程。天气从晴天转为多云的时间服从
,从多云转为雨天的时间服从
,从雨天转为晴天服从
。刻画这个连续时间马尔科夫链的转移速率矩阵
,并得出长期来看,各个天气占据时间的比例。
这个
不难得到,假如说晴天状态是1,多云状态是2,雨天状态是3,那么有
状态则是按照
的顺序从左到右,从上到下排序的。比方说
表示从状态1到状态2,转移速率为
,这对应一个
的指数分布。
那么这样的话,求解
,可以得到
注意这里不能使用细致平衡条件。
因此可以得到,晴天,多云和雨天的时间占比为
。感兴趣的读者可以使用更新奖赏过程中,交替更新过程的方法进行建模,利用指数分布的无记忆性,可以发现这个时候,结果是一致的。
Problem 6: 考虑一个理发店排队论模型
,理发店理发服从一个速率为
的泊松过程(平均每一个小时完成3个人),顾客到达服从一个速率为
的泊松过程。但如果顾客前面已经有2个人排队,则顾客会离开。刻画这个模型,并求解出进入系统的人中,长期来看平均在系统停留的时间。
那么我们可以看出这个时候,定义状态
表示系统里有
个人的话,就不难得到
当然这个没有考虑人离开的情况,具体怎么加上这个条件会在后面说。当然因为这个我们可以知道,队伍里最多只会有3个人。
这个转移速率知道之后,再补上对角线上的
,我们就可以求解
,得到
注意在这里可以使用细致平衡条件。具体什么时候可以使用什么时候不可以使用,在之前的离散马尔科夫链的部分我们提过一个小的方法,不熟悉的读者可以回去翻一下。
https://zhuanlan.zhihu.com/p/335796325
而这个就对应“系统里有
个人“占据的时间比。比方说从这个结论中,我们可以看出“系统里有3个人”占据的时间比为
。
前方一个小高能。注意到上一节的PASTA性质,系统里有3个人所占据的时间和“某个人到达之后系统里有3个人所占据的比例”是相同的。因此相当于说,这里有
的人会离开系统,不接受服务(加入他们的时候系统里有3个人,相当于没到的时候系统有2个人,符合离开的条件)。也就是说,这里的排队论模型是有阻拦的(balking),对应的是
。
去掉这一部分人之后,剩下的人都接受了服务,那么直接求期望可以得到
这里的单位是min。
这里
对应的是“看到系统里没有人”的情况,所以相当于这一段时间,有一个人接受服务,那么因为平均一个小时服务3人,所以这一段时间,这一部分人在系统停留的平均时间就是20min。
好的,关于连续时间马尔科夫链的例子,我们就说到这里。这一节我们提了很多例子,也是希望可以通过例子,将连续时间马尔科夫链的理论,性质,与其对应的实际的应用可以相关联起来。
小结
本节主要介绍了连续时间马尔科夫链的转移速率的描述和对应的泊松过程的形象化描述。虽然说是“形象化描述”,但却是我们最为常用的理解和分析连续时间马尔科夫链问题的工具。同时这一节我们也介绍了大量与离散马尔科夫链的对比性质,因此如果对离散马尔科夫链的结论感到陌生,这一节的阅读就会产生较大的困难。不过这也是这一部分内容的常态了。