lda,latent diriclet allocation,是一个最基本的bayesian模型。本文要研究lda基于变分的推导方法。意义是重大的。一、符号的定义: the number of topics: the number of documents: the number of terms ...
分类:
其他好文 时间:
2014-09-03 10:49:46
阅读次数:
239
ArcGIS for Server使用AD中的用户配置
1、概述
默认情况下,ArcGIS Server使用内置存储模式来管理用户和角色。该模式使用基于文件格式来存储信息。当然,ArcGIS Server也支持将用户和角色信息由第三方接管,如使用企业系统中的用户和角色。目前支持的企业用户系统有LDA...
分类:
其他好文 时间:
2014-09-02 10:28:24
阅读次数:
271
一、LDA的基本思想线性判别式分析(LinearDiscriminantAnalysis,LDA),也叫做Fisher线性判别(FisherLinearDiscriminant,FLD),是模式识别的经典算法,它是在1996年由Belhumeur引入模式识别和人工智能领域的。线性鉴别分析的基本思想是...
分类:
其他好文 时间:
2014-08-27 01:34:47
阅读次数:
469
项目原理概述利用sqoop将数据从MySQL导入到HDFS中,利用mahout的LDA的cvb实现对输入数据进行聚类,并将结果更新到数据库中。数据流向图如下mahout算法分析输入数据格式为的matrix矩阵,key为待聚类文本的数字编号,value为待聚类文本的单词向量Vector, Vector...
分类:
其他好文 时间:
2014-07-07 10:43:16
阅读次数:
1186
转载请注明:电子科技大学EClab——落叶花开http://www.cnblogs.com/nlp-yekai/p/3816532.html困惑度一般在自然语言处理中用来衡量训练出的语言模型的好坏。在用LDA做主题和词聚类时,原作者D.Blei就是采用了困惑度来确定主题数量。文章中的公式为:perp...
分类:
编程语言 时间:
2014-07-02 18:03:38
阅读次数:
827
LDA是一个关于语料的生成概率模型,基本思想是文档可以表达为隐含主题的随机混合,每个主题刻画为关于词语的分布。LDA假设在语料D中生成一篇文章w的过程如下:1.根据泊松分布选在文章长度N2. 选择主题分布3. 对于每一个词Wn (a)根据多项式分布选择一个主题 (b)根据多项式条件概率分布选...
分类:
其他好文 时间:
2014-06-18 21:00:30
阅读次数:
275
Topic Model的分类和设计原则http://blog.csdn.net/xianlingmao/article/details/7065318topic model的介绍性文章已经很多,在此仅做粗略介绍,本文假设读者已经较为熟悉Topic Medel。Topic Model (LDA)认为一...
分类:
其他好文 时间:
2014-06-18 13:39:47
阅读次数:
252
这篇博客根据中文自然语言预处理的步骤分成几个板块。以做LDA实验为例,在处理数据之前,会写一个类似于实验报告的东西,用来指导做实验,OK,举例:一,实验数据预处理(python,结巴分词)1.对于爬取的评论做分词和词性标注处理(mac-result.txt)2.对于结果只用公版的停用词表去停用词,不...
分类:
编程语言 时间:
2014-06-03 06:45:21
阅读次数:
385
使用OpenCV编写的LDA程序----C++ LDA代码...
分类:
编程语言 时间:
2014-05-26 03:42:11
阅读次数:
402
OpenCV LDA(Linnear Discriminant analysis)类的使用---OpenCV LDA示例...
分类:
其他好文 时间:
2014-05-25 00:43:43
阅读次数:
337