抽样理论中有哪些令人印象深刻(有趣)的结论?

2019-10-28 18:22:32 浏览数 (1)

我们知道很多蒙特卡洛采样方法是来源于物理,比如最有名的哈密顿蒙特卡洛方法(HMC),就是源自于哈密顿动力学。不过这次我并不打算详细说明哈密顿蒙特卡洛,相关的解读已经很多了。

今天我想讲另一个大家可能不怎么在意的郎之万动力学(Langevin dynamics)采样法,没错就是那位传说和居里夫人有绯闻的郎之万同学。

我们先讲结论,郎之万动力学采样方法源自于布朗运动,同时也是一个变优化为采样的神奇方法。没错就是那个出现在了高中物理课本中的布朗运行。很难想象,一个常见的物理现象竟然会延申出一个采样方法,就让我们看一下到底发生了什么?

布朗运动

朗之万方程描述的是布朗运动,即由于与流体分子的碰撞,粒子的随机运动方程为:

其中

是粒子的位置, 是粒子的质量。右边式子的第一项是流体的粘滞力,第二项就是分子热运动带来的碰撞力,也叫做热涨落。它有个特点就是时间上平均值等于0。通过解方程(1),我们可以得到:

其中

和温度成正比。这个解的意思是,布朗运动粒子平均运动位置离原点(初始点)距离的平方和时间成正比。这个解就是对扩散运动的一个直观解释,随着时间推移,粒子跑的越来越“散”。

额外补充一句就是上面的式子也被叫做爱因斯坦关系,由阿尔伯特·爱因斯坦在1905年和Marian Smoluchowski在1906年独立发现。

重现玻尔兹曼分布

我们知道抽样方法的目标就是抽样一个分布,那么布朗运动和分布又有什么关系呢?

假设粒子在一个势能 中运动,它的运动方程由郎之万动力学描述:

按照(1)式相同的解法,我们会得到关于粒子位置 分布的解:

这个方程就是我们常见的玻尔兹曼分布。通过郎之万方程,我们竟然获得了粒子的分布。

郎之万动力学采样法

我们从布朗运动出发,通过郎之万动力学,架起来动力学和分布的桥梁。接下来就可以利用这个桥梁来采样了:

通过模拟动力学来采样分布,具体而言就是精确模拟粒子在势能以及热涨落中运动,捕捉粒子的位置,作为样本,就会得到想要的分布。

最后要给大家交代的就是“势能”以及“热涨落”怎么来模拟:

热涨落力具有高斯分布,于是我们可以用高斯分布来模拟这个力:

对于贝叶斯分布后验分布,

根据玻尔兹曼分布,其势能就是

于是势能力就可以通过对势能求梯度而获得。

于是当势能和热涨落都可以模拟的情况下,我们就可以通过模拟粒子运动来采样了:

这个公式来自于Bayesian Learning via Stochastic Gradient Langevin Dynamics,具体细节大家可以参考这篇文章:

https://www.ics.uci.edu/~welling/publications/papers/stoclangevin_v6.pdf

最后要补充的就是,如果去掉高斯项

,剩下的部分就是梯度项,不就是我们常见的梯度法(gradient method)来优化目标函数吗?从这个角度而言,在梯度项上面加一个平凡无奇的高斯项就可以化优化为采样,实在是太神奇了!

0 人点赞