了解LDA需要明白如下数学原理:
一个函数:gamma函数
四个分布:二项分布、多项分布、beta分布、Dirichlet分布
一个概念和一个理念:共轭先验和贝叶斯框架
两个模型:pLSA、LDA(文...
分类:
其他好文 时间:
2016-10-21 20:22:07
阅读次数:
437
隐含狄利克雷分布简称LDA(Latent Dirichlet allocation),是一种主题模型,它可以将文档集中每篇文档的主题按照概率分布的形式给出。同时它是一种无监督学习算法,在训练时不需要手...
分类:
其他好文 时间:
2016-09-06 09:11:09
阅读次数:
7795
http://blog.csdn.net/pipisorry/article/details/51525308
吉布斯采样的实现问题
本文主要说明如何通过吉布斯采样进行文档分类(聚类),当然更复杂的实现可以看看吉布斯采样是如何采样LDA主题分布的[主题模型TopicModel:隐含狄利克雷分布LDA
]。
关于吉布斯采样的介绍文章都停止在吉布斯采样的详细描述上,如随机采样和随机...
分类:
其他好文 时间:
2016-05-30 14:50:50
阅读次数:
277
之前几篇文章讲到了文档主题模型,但是毕竟我的首要任务还是做分类任务,而涉及主题模型的原因主要是用于text representation,因为考虑到Topic Model能够明显将文档向量降低维度,当然TopicModel可以做比这更多的事情,但是对于分类任务,我觉得这一点就差不多了。
LDA之前已经说到过,是一个比较完善的文档主题模型,这次试用的是JGibbsLDA开源的LDA代...
分类:
其他好文 时间:
2016-05-07 10:16:11
阅读次数:
463
项目运行时,出现了这个问题,很郁闷,半天找不到错误出处,后来联想了一下之前解决的一个bug和这个可能相类似,就试了一下,果然是这个问题
我的jsp页面有这样一段代码:
title="关注 ${topicModel.nickname} ${topicModel.userid}">关注
大家注意到,在这里是否有将String转化为Lang的情况,根据我的猜测,我把代码改...
分类:
编程语言 时间:
2015-06-01 18:57:14
阅读次数:
140
错误情况:
var curtopicid=${topicModel.topicid };
解决:
var curtopicid='${topicModel.topicid }';
评论(${topicModel.replycount})...
分类:
其他好文 时间:
2015-05-27 10:16:11
阅读次数:
125
应用于推荐系统
在使用LDA(Latent Dirichlet Allocation)计算物品的内容相似度时,我们可以先计算出物品在话题上的分布,然后利用两个物品的话题分布计算物品的相似度。比如,如果两个物品的话题分布相似,则认为两个物品具有较高的相似度,反之则认为两个物品的相似度较低。计算分布的相似度可以利用KL散度来计算:
DKL(p||q)=∑i∈Xp(i)ln(p(i)/q(i),其中...
分类:
其他好文 时间:
2015-05-12 11:28:46
阅读次数:
175
http://blog.csdn.net/pipisorry
Browse LDA Topic Models
This package allows you to create a set of HTML files to browse a topic model.It creates a word cloud and time-graph per topic, and annotat...
分类:
其他好文 时间:
2015-04-29 19:46:18
阅读次数:
393
LDA limitations: what’s next?
Although LDA is a great algorithm for topic-modelling, it still has some limitations, mainly due to the fact that it’s has become popular and available to the mass rec...
分类:
其他好文 时间:
2015-04-27 11:14:29
阅读次数:
379
ABSTRACT摘要
Topic modeling has been widely used to mine topics from documents. However,
a key weakness of topic modeling is that it needs a large amount of data (e.g., thousands of doc- ument...
分类:
其他好文 时间:
2015-01-29 16:02:57
阅读次数:
189