蒙特卡罗方法

时间：2018-03-04 15:59:00 阅读：217 评论：0 收藏：0 [点我收藏+]

　作为一种随机采样方法，马尔科夫链蒙特卡罗（Markov Chain Monte Carlo，以下简称MCMC）在机器学习,深度学习以及自然语言处理等领域都有广泛的应用，是很多复杂算法求解的基础。比如我们前面讲到的分解机(Factorization Machines)推荐算法，还有前面讲到的受限玻尔兹曼机（RBM）原理总结，都用到了MCMC来做一些复杂运算的近似求解。下面我们就对MCMC的原理做一个总结。

1. MCMC概述

　　　　从名字我们可以看出，MCMC由两个MC组成，即蒙特卡罗方法（Monte Carlo Simulation，简称MC）和马尔科夫链（Markov Chain ，也简称MC）。要弄懂MCMC的原理我们首先得搞清楚蒙特卡罗方法和马尔科夫链的原理。我们将用三篇来完整学习MCMC。在本篇，我们关注于蒙特卡罗方法。

2. 蒙特卡罗方法引入

　　　　蒙特卡罗原来是一个赌场的名称，用它作为名字大概是因为蒙特卡罗方法是一种随机模拟的方法，这很像赌博场里面的扔骰子的过程。最早的蒙特卡罗方法都是为了求解一些不太好求解的求和或者积分问题。比如积分：

θ = \int b a f (x) d x

　　　　如果我们很难求解出 $f (x)$

技术分享图片

　　　　则一个简单的近似求解方法是在[a,b]之间随机的采样一个点。比如 $x_{0}$

(b ? a) f (x 0)

　　　　当然，用一个值代表[a,b]区间上所有的 $f (x)$

b ? a n \sum i = 0 n ? 1 f ( x i )

　　　　虽然上面的方法可以一定程度上求解出近似的解，但是它隐含了一个假定，即 $x$

　　　　怎么解决这个问题呢？如果我们可以得到 $x$

θ = \int b a f (x) d x = \int b a f ( x ) p ( x ) p ( x ) d x \approx 1 n \sum i = 0

　　　　上式最右边的这个形式就是蒙特卡罗方法的一般形式。当然这里是连续函数形式的蒙特卡罗方法，但是在离散时一样成立。

　　　　可以看出，最上面我们假设 $x$

1 n \sum i = 0 n ? 1 f ( x i ) 1 / ( b ? a ) = b ? a n \sum

　　　　也就是说，我们最上面的均匀分布也可以作为一般概率分布函数 $p (x)$

3. 概率分布采样

　　　　上一节我们讲到蒙特卡罗方法的关键是得到 $x$

　　　　对于常见的均匀分布 $u n i f o r m (0, 1)$

Z 1 = ? 2 l n X 1???????\sqrt c o s (2 π X 2)

Z 2 = ? 2 l n X 1???????\sqrt s i n (2 π X 2)

　　　　其他一些常见的连续分布，比如t分布，F分布，Beta分布，Gamma分布等，都可以通过类似的方式从 $u n i f o r m (0, 1)$

　　　　不过很多时候，我们的 $x$

4. 接受-拒绝采样

　　　　对于概率分布不是常见的分布，一个可行的办法是采用接受-拒绝采样来得到该分布的样本。既然 $p (x)$

技术分享图片

　　　　具体采用过程如下，设定一个方便采样的常用概率分布函数 $q (x)$

　　　　首先，采样得到 $q (x)$

1 n \sum i = 0 n ? 1 f ( z i ) p ( z i )

　　　　整个过程中，我们通过一系列的接受拒绝决策来达到用 $q (x)$

5. 蒙特卡罗方法小结

　　　　使用接受-拒绝采样，我们可以解决一些概率分布不是常见的分布的时候，得到其采样集并用蒙特卡罗方法求和的目的。但是接受-拒绝采样也只能部分满足我们的需求，在很多时候我们还是很难得到我们的概率分布的样本集。比如：

　　　　1）对于一些二维分布 $p (x, y)$

　　　　2）对于一些高维的复杂非常见分布 $p (x_{1}, x_{2}, . . ., x_{n})$

　　　　从上面可以看出，要想将蒙特卡罗方法作为一个通用的采样模拟求和的方法，必须解决如何方便得到各种复杂概率分布的对应的采样样本集的问题。而我们下一篇要讲到的马尔科夫链就是帮助找到这些复杂概率分布的对应的采样样本集的白衣骑士。下一篇我们来总结马尔科夫链的原理。

蒙特卡罗方法

标签：原理重复 body 名称结果函数 isp msu data

原文地址：https://www.cnblogs.com/jialin0421/p/8504462.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行