码迷,mamicode.com
首页 >  
搜索关键字:lda    ( 905个结果
TopicModel主题模型 - 主题模型的应用
应用于推荐系统 在使用LDA(Latent Dirichlet Allocation)计算物品的内容相似度时,我们可以先计算出物品在话题上的分布,然后利用两个物品的话题分布计算物品的相似度。比如,如果两个物品的话题分布相似,则认为两个物品具有较高的相似度,反之则认为两个物品的相似度较低。计算分布的相似度可以利用KL散度来计算: DKL(p||q)=∑i∈Xp(i)ln(p(i)/q(i),其中...
分类:其他好文   时间:2015-05-12 11:28:46    阅读次数:175
Expectation Maximization(EM)算法note
EM算法,之前上模式识别课上,推导过,在《统计学习方法》中没耐性的看过几次,个人感觉讲的过于理论,当时没怎么看懂,后来学lda,想要自己实现一下em算法,又忘记了,看来还是学的不够仔细,认识的不够深刻,现在做点笔记。本文是看了几篇blog和《统计学习方法》之后做的笔记,只是用来给自己做记录,很多.....
分类:编程语言   时间:2015-05-10 17:09:57    阅读次数:357
TopicModel主题模型 - 主题模型可视化
http://blog.csdn.net/pipisorry Browse LDA Topic Models This package allows you to create a set of HTML files to browse a topic model.It creates a word cloud and time-graph per topic, and annotat...
分类:其他好文   时间:2015-04-29 19:46:18    阅读次数:393
线性判别分析(LDA), 主成分分析(PCA)及其推导【转】
前言:如果学习分类算法,最好从线性的入手,线性分类器最简单的就是LDA,它可以看做是简化版的SVM,如果想理解SVM这种分类器,那理解LDA就是很有必要的了。 谈到LDA,就不得不谈谈PCA,PCA是一个和LDA非常相关的算法,从推导、求解、到算法最终的结果,都有着相当的相似。 本次的内容主要是以推...
分类:其他好文   时间:2015-04-29 16:52:02    阅读次数:286
TopicModel主题模型 - LDA的缺陷和改进
LDA limitations: what’s next? Although LDA is a great algorithm for topic-modelling, it still has some limitations, mainly due to the fact that it’s has become popular and available to the mass rec...
分类:其他好文   时间:2015-04-27 11:14:29    阅读次数:379
LDA基本介绍以及LDA源码分析(BLEI)
基本介绍: topic model,主题模型介绍:http://www.cnblogs.com/lixiaolun/p/4455764.html 以及(http://blog.csdn.net/hxxiaopei/article/details/7617838) topic model本质上就一.....
分类:其他好文   时间:2015-04-26 19:30:26    阅读次数:230
LDA Gibbs Sampling
注意:$\alpha$和$\beta$已知,常用为(和LDA EM算法不同)1. 为什么可用LDA模型求解的目标为得到$\phi$和$\theta$假设现在已知每个单词对应的主题$z$,则可以求得$\theta$的后验分布,求期望得到$E(\theta)$作为每份文档的主题$E(\theta_{mk...
分类:其他好文   时间:2015-04-23 12:22:33    阅读次数:173
PCA与LDA区别与联系
这两种方法都是KL变换的一种形式吧,PCA主要是把高位数据投影到k个低维的正交坐标轴上,来实现尽量保留原始信息 LDA主要是类内与类外的散列程度,该方法投影后的坐标轴不一定正交(因为scatter矩阵不一定是对角的) 两种方法都会转化为求解矩阵特征值特征向量,而且是选择最大的K个特征值对应的...
分类:其他好文   时间:2015-04-18 19:03:09    阅读次数:858
LDA(latent dirichlet allocation)
1.LDA介绍LDA假设生成一份文档的步骤如下:模型表示:单词w:词典的长度为v,则单词为长度为v的,只有一个分量是1,其他分量为0的向量 $(0,0,...,0,1,0,...,0,0)$文档W: 单词的组合,$(w_1,w_2,...,w_N)$,可以看成是 $v*N$ (词典长度*单词个...
分类:其他好文   时间:2015-04-17 18:01:50    阅读次数:222
mahout运行测试与kmeans算法解析
在使用mahout之前要安装并启动hadoop集群将mahout的包上传至linux中并解压即可mahout下载地址:点击打开链接mahout中的算法大致可以分为三大类:聚类,协同过滤和分类其中常用聚类算法有:canopy聚类,k均值算法(kmeans),模糊k均值,层次聚类,LDA聚类等常用分类算...
分类:编程语言   时间:2015-04-15 21:13:03    阅读次数:170
905条   上一页 1 ... 84 85 86 87 88 ... 91 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!