首页 > 其他好文 > 详细

gibbs采样

时间：2017-03-30 19:21:03 阅读：221 评论：0 收藏：0 [点我收藏+]

标签：含义 auto 机器 aaa border 建图随机 size title

gibbs采样

关键字一

关键字二

参数估计与预测

机器学习的一般思路为：
1.从问题的本质中构建模型，定义样本的产生，有联合概率(图模型)。
2.进行模型参数的估计：MLE、MAP、Bayes。
3.使用模型对新样本进行估计。

MLE：极大似然估计
估计：解优化函数

预测：

MAP：极大后验估计
估计：解优化函数

预测：

对比极大似然估计，引入了关于

的先验知识。

Bayes估计
估计：后验概率

预测：

对于MLE和MAP算法，对模型参数进行点估计，没有考虑未知样本导致的模型参数的不确定性；对于Bayes估计，参数的后验概率有时很难求解，特别是在多参数联合分布的情况下，因此引入了近似求解的方法，引入gibbs采样，直接采样得到

gibbs采样的Naive Bayes模型

输入信息

1.有一组文本集合，利用BagOfWords模型，可以将每个文本表示成单词数量向量（经典的Naive Bayes模型将向量只有0,1两种状态）。
2.每个文本可以有标签，也可以没有标签。
3.模型的本质含义是将词向量分布相近的文档归为一类。

构建图模型

技术分享
上述图模型描述了整个文档集合的构建过程。
对于每一个文档
1.首先选定类别标签，这个抽样过程服从参数为的0-1分布。
2.接着根据类别标签生成文档的词向量，其中服从参数为的多项式分布。
如果以MLE的观点，将参数、、作为固定值，似然概率为，当然，这里存在隐变量，需要用EM算法进行求解。
但是，以Bayes的观点，不能对模型参数进行点估计，而是认为参数也是一个随机变量，因此引入超参数来描述参数的分布。
具体的，0-1分布的随机参数服从参数为的Beta分布。多项分布的参数和服从参数为的Dirichlet分布。
Beta分布

Dirichlet分布

可以看出，Dirichlet分布是Beta分布的多维拓展。
由于我们通过引入图模型，只是知道了文档的生成方式，但对于

的分布以及

的分布并不了解，因此引入无信息的先验，也即

，同理

各个元素都是1

写出联合概率

继续化解，将

积分掉，有：

其中

构建gibbs采样

构建gibbs采样的函数，主要是计算各个随机变量的单独的条件分布。
首先对文档的标签采样：

抽样过程：
1.令

，计算value0
2.令

，计算value1
3.对分布律

进行抽样，得到

接着对参数

进行采样

标签：含义 auto 机器 aaa border 建图随机 size title

原文地址：http://www.cnblogs.com/zjgtan/p/6647335.html

踩

(0)

赞

(0)

举报

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

更多

友情链接

兰亭集智国之画百度统计站长统计阿里云 chrome插件新版天听网

关于我们 - 联系我们 - 留言反馈

© 2014 mamicode.com 版权所有联系我们:gaon5@hotmail.com

迷上了代码！