1.LDA主题模型 给定先验概率参数αβ,主题混合参数θ,集合主题z,集合词w的联合分布为 (1)2.variational inference1>variational distribution variational inference algorithm 介绍的variational 分...
分类:
其他好文 时间:
2015-01-08 22:37:44
阅读次数:
420
LDA主题模型好坏的评估,判断改进的参数或者算法的建模能力。
Blei先生在论文《Latent Dirichlet Allocation》实验中用的是Perplexity值作为评判标准。
一、Perplexity定义
http://en.wikipedia.org/wiki/Perplexity
perplexity是一种信息理论的测量方法,b的perplexity值定义为基于b的...
分类:
其他好文 时间:
2015-01-06 17:58:56
阅读次数:
232
关注点:(1)主题模型的应用(2)文献计量学的实际应用,预测方法Time gap analysis by the topic model-based temporal technique使用LDA模型来确定不同资源类型的时间窗划分方法。Classification of individual art...
分类:
其他好文 时间:
2014-12-23 12:06:04
阅读次数:
185
相关链接http://blog.csdn.net/column/details/datamining.html通俗理解LDA主题模型http://blog.csdn.net/v_july_v/article/details/41209515从贝叶斯方法谈到贝叶斯网络http://blog.csdn....
分类:
编程语言 时间:
2014-12-08 12:10:58
阅读次数:
293
PLSA是前面LSA的兄弟版,相比于LSA而言,PLSA定义了概率模型,而且每个变量以及相应的概率分布和条件概率分布都有明确的物理解释了。这篇博文我们分三部分来说PLSA:基本思想,EM算法推导,以及优缺点分析。...
分类:
其他好文 时间:
2014-12-04 12:21:21
阅读次数:
418
http://blog.csdn.net/july_2/article/details/12710147http://blog.csdn.net/huagong_adu/article/details/7937616
分类:
其他好文 时间:
2014-12-02 10:21:03
阅读次数:
158
LDA(LatentDirichletAllocation)主题模型算法(初略讲了下,可以对LDA有个大概认识)建议的程序员学习LDA算法的步骤(作者的切身体会,赞)“眼泪”与“门外汉”——向自然语言处理的大牛们学习
分类:
其他好文 时间:
2014-10-26 16:49:32
阅读次数:
142
LDA整体流程先定义一些字母的含义:文档集合D,topic集合TD中每个文档d看作一个单词序列,wi表示第i个单词,设d有n个单词。(LDA里面称之为word
bag,实际上每个单词的出现位置对LDA算法无影响)D中涉及的所有不同单词组成一个大集合VOCABULARY(简称VOC)LDA以文档集合D...
分类:
其他好文 时间:
2014-05-23 03:28:59
阅读次数:
562
Gibbslda有很多版本,我所用的版本为C++版(下载地址http://gibbslda.sourceforge.net/),平台是linux,博主试过windows上运行,有两个主要问题很烦~,一个是path,一个是平台太大。最后还是投入了ubuntu的怀抱,感觉配置好g++环境后速度还不错。由...
分类:
其他好文 时间:
2014-05-12 12:11:43
阅读次数:
295
seo优化如何让网站快速进入百度前5页
引言:分析同行优秀的竞争对手的网站可以让你的网站少走弯路,取其优点,进入百度优质站点行列,快速进入百度前5页
为什么要分析优秀竞争对手的网站?(百度第一页的网站)
任何事物的存在必有其存在的理由
网站排在第一位,说明百度认可该网站,说明网站的布局、内容质量、内外链接都符合百度的优质站点标准
百度在分析网站的时候,会建主题模型,提取优秀站点中...
分类:
Web程序 时间:
2014-05-08 15:50:48
阅读次数:
380