topic model

时间：2014-08-09 02:24:56 阅读：234 评论：0 收藏：0 [点我收藏+]

0、基石——贝叶斯推断

计算后验概率即为我们对参数的估计：

bubuko.com,布布扣

其中：

? ??——输入数据

? ???——待估计的参数

? ??——似然分布

? ???——参数的先验分布

对新样本的预测：我们要估计的概率

1、常用的概率分布

Dirichlet Distribution

bubuko.com,布布扣

2、文本建模

2.1 基本模型——unigram model

最基本的一种文本模型。

我们做这样的假设：语料库是从词表中独立的抽取的个。有似然方程

bubuko.com,布布扣其中是term[t]出现的次数。我们的目标是估计，根据贝叶斯推断的方法，我们需要引入的一个先验分布。

计算后验概率

原文地址：http://www.cnblogs.com/zjgtan/p/3900362.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

周排行