码迷,mamicode.com
首页 > 其他好文 > 详细

topic model

时间:2014-08-09 02:24:56      阅读:234      评论:0      收藏:0      [点我收藏+]

标签:style   blog   http   io   数据   2014   ar   div   

0、基石——贝叶斯推断

计算后验概率即为我们对参数的估计:

bubuko.com,布布扣

其中:

? ??bubuko.com,布布扣——输入数据

? ??bubuko.com,布布扣?——待估计的参数

? ??bubuko.com,布布扣——似然分布

? ??bubuko.com,布布扣?——参数的先验分布

?

对新样本的预测:我们要估计bubuko.com,布布扣的概率

bubuko.com,布布扣

1、常用的概率分布

Dirichlet Distribution

bubuko.com,布布扣

2、文本建模

2.1 基本模型——unigram model

最基本的一种文本模型。

我们做这样的假设:语料库是从词表bubuko.com,布布扣中独立的抽取的bubuko.com,布布扣个。有似然方程

bubuko.com,布布扣其中bubuko.com,布布扣是term[t]出现的次数。我们的目标是估计bubuko.com,布布扣,根据贝叶斯推断的方法,我们需要引入bubuko.com,布布扣的一个先验分布。

bubuko.com,布布扣计算后验概率

bubuko.com,布布扣?

?

?

?

?

?

topic model,布布扣,bubuko.com

topic model

标签:style   blog   http   io   数据   2014   ar   div   

原文地址:http://www.cnblogs.com/zjgtan/p/3900362.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!