码迷,mamicode.com
首页 > 其他好文 > 详细

lda:变分的推导

时间:2014-09-03 10:49:46      阅读:239      评论:0      收藏:0      [点我收藏+]

标签:style   blog   http   os   io   使用   ar   2014   sp   

lda,latent diriclet allocation,是一个最基本的bayesian模型。本文要研究lda基于变分的推导方法。意义是重大的。

一、符号的定义

bubuko.com,布布扣: the number of topics
bubuko.com,布布扣?: the number of documents
bubuko.com,布布扣?: the number of terms in vocabulary
bubuko.com,布布扣?: index topic
bubuko.com,布布扣?: index document
bubuko.com,布布扣?: index word
bubuko.com,布布扣?: denote a word

in LDA:
bubuko.com,布布扣: model parameter
bubuko.com,布布扣?: model parameter
bubuko.com,布布扣?,bubuko.com,布布扣: hidden variables.

图模型:
bubuko.com,布布扣引入variational parameter:
bubuko.com,布布扣?: Dirichlet parameter
bubuko.com,布布扣?: Multinomial parameter

我们引入variational distribution,a fully factorized model

bubuko.com,布布扣?bubuko.com,布布扣要注意的是,bubuko.com,布布扣?是后验分布,我们隐去了given?bubuko.com,布布扣?

二、总论

我们使用了variational EM algorithm:
在E step,我们使用variational approximation to posterior来最优化variational parameters,找到最靠谱的后验分布。
在M step,我们提升lower bound with respect to the model parameters。

具体算法:
E-step: 对于每一个文档,find optimal values of the variational parameters

bubuko.com,布布扣

?M-step:maximize the lower bound with respect to the model parameters?bubuko.com,布布扣?and?bubuko.com,布布扣

?

?

?

?

?

lda:变分的推导

标签:style   blog   http   os   io   使用   ar   2014   sp   

原文地址:http://www.cnblogs.com/zjgtan/p/3952994.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!