码迷,mamicode.com
首页 >  
搜索关键字:主题模型    ( 112个结果
TopicModel主题模型 - 主题模型的应用
应用于推荐系统 在使用LDA(Latent Dirichlet Allocation)计算物品的内容相似度时,我们可以先计算出物品在话题上的分布,然后利用两个物品的话题分布计算物品的相似度。比如,如果两个物品的话题分布相似,则认为两个物品具有较高的相似度,反之则认为两个物品的相似度较低。计算分布的相似度可以利用KL散度来计算: DKL(p||q)=∑i∈Xp(i)ln(p(i)/q(i),其中...
分类:其他好文   时间:2015-05-12 11:28:46    阅读次数:175
TopicModel主题模型 - 主题模型可视化
http://blog.csdn.net/pipisorry Browse LDA Topic Models This package allows you to create a set of HTML files to browse a topic model.It creates a word cloud and time-graph per topic, and annotat...
分类:其他好文   时间:2015-04-29 19:46:18    阅读次数:393
用主题模型可视化分析911新闻(Python版)
本文由伯乐在线-东狗翻译,toolate校稿。未经许可,禁止转载!英文出处:blog.dominodatalab.com。欢迎加入翻译小组。本文介绍一个将911袭击及后续影响相关新闻文章的主题可视化的项目。我将介绍我的出发点,实现的技术细节和我对一些结果的思考。简介近代美国历史上再没有比911袭击影...
分类:编程语言   时间:2015-04-28 09:27:46    阅读次数:213
TopicModel主题模型 - LDA的缺陷和改进
LDA limitations: what’s next? Although LDA is a great algorithm for topic-modelling, it still has some limitations, mainly due to the fact that it’s has become popular and available to the mass rec...
分类:其他好文   时间:2015-04-27 11:14:29    阅读次数:379
LDA基本介绍以及LDA源码分析(BLEI)
基本介绍: topic model,主题模型介绍:http://www.cnblogs.com/lixiaolun/p/4455764.html 以及(http://blog.csdn.net/hxxiaopei/article/details/7617838) topic model本质上就一.....
分类:其他好文   时间:2015-04-26 19:30:26    阅读次数:230
主题模型
摘要: 两篇文档是否相关往往不只决定于字面上的词语重复,还取决于文字背后的语义关联。对语义关联的挖掘,可以让我们的搜索更加智能化。本文着重介绍了一个语义挖掘的利器:主题模型。主题模型是对文字隐含主题进行建模的方法。它克服了传统信息检索中文档相似度计算方法的缺点,并且能够在海量互联网数据中自动寻找出....
分类:其他好文   时间:2015-04-25 13:36:03    阅读次数:323
打个广告:承接本硕毕业设计和其他外包项目
本人某Top高校硕士毕业,承接本硕毕业设计和其他相关项目。对于硕士方面,本人可以承接自然语言处理,文本挖掘,数据挖掘,主题模型等相关算法。工程类硕士一般应用系统开发均可。本科相关毕设应用系统均可。本人熟悉的语言有C#、Java、C++,主要从事B/S开发。熟悉论文撰写。本信息常年有效。咨询联系QQ:...
分类:其他好文   时间:2015-04-17 13:14:50    阅读次数:165
PLSA模型的再理解以及源码分析
PLSA模型的再理解以及源码分析         之前写过一篇PLSA的博文,其中的收获就是知道PLSA是LSA在概率层面的扩展,知道了PLSA是一种主题模型,知道了PLSA中的参数估计使用的是EM算法。当时我就认为,这样子经典好用的算法,我是会回头再来理解它的,这样子才会有更加深刻的心得。所以有了这篇PLSA模型的再理解。 1. 两种思路解PLSA模型     参考了很多...
分类:其他好文   时间:2015-01-30 22:50:32    阅读次数:663
JGibbLDA、GibbsLDA++问题解决
LDA(Latent Dirichlet Allocation)主题模型是一种用统计进行文本挖掘的方法,它是pLSA(概率潜在语义分析)主题模型基础上加上贝叶斯框架而得到的模型。目前已应用于自然语言处理、计算机视觉、机器学习、信息检索等领域,得到了广泛关注。 LDA模型网上有多个开源代码,...
分类:其他好文   时间:2015-01-14 15:31:05    阅读次数:308
中文分词和去停用词
最近学习主题模型pLSA、LDA,就想拿来试试中文。首先就是找文本进行切词、去停用词等预处理,这里我找了开源工具IKAnalyzer2012,下载地址:https://code.google.com/p/ik-analyzer/由于太多,而且名称我也搞不清楚,不知道下载哪个。后来我下载了可是本文Ja...
分类:其他好文   时间:2015-01-14 00:40:27    阅读次数:3869
112条   上一页 1 ... 8 9 10 11 12 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!