码迷,mamicode.com
首页 >  
搜索关键字:plsa    ( 55个结果
几种简单的主题模型(生成模型)
了解主题模型,一般都会提到几种最基础的生成模型:Unigram model、Mixture of unigram,pLSA,接下来简单介绍一下他们之间的区别: 1.Unigram model 左图可知,一篇文档由词生成,每个词有其出现的概率,所有词概率的乘积即得到生成文档的概率。 2.Mixture ...
分类:其他好文   时间:2018-10-20 23:45:03    阅读次数:290
LDA主题模型
PLSA模型是基于频率派思想的,每篇文档的K个主题是固定的,每个主题的词语概率也是固定的,我们最终要求出固定的topic-word概率模型。贝叶斯学派显然不认同,他们认为,文档的主题未知,主题的词语分布未知,我们无法求解出精确值,只能计算doc-topic概率模型、topic-word概率模型的概率 ...
分类:其他好文   时间:2018-10-06 10:48:28    阅读次数:252
PLSA主题模型
主题模型 主题模型这样理解一篇文章的生成过程: 1、 确定文章的K个主题。 2、 重复选择K个主题之一,按主题-词语概率生成词语。 3、 所有词语组成文章。 这里可以看到,主题模型仅仅考虑词语的数量,不考虑词语的顺序,所以主题模型是词袋模型。 主题模型有两个关键的过程: 1、 doc -> topi ...
分类:其他好文   时间:2018-10-05 21:04:33    阅读次数:185
mysql免安装版的下载与安装
下载 下载 下载 打开:https://www.mysql.com/downloads/ 1.点击该项:, 2. 进去后点击: 3.到了真正的下载页面,选择平台,选择版本(安装版和免安装版),下载 4,我现在下载免安装版的“Windows (x86, 64-bit), ZIP Archive” 安装 ...
分类:数据库   时间:2018-09-17 22:13:07    阅读次数:208
基于One-Class的矩阵分解方法
在矩阵分解中。 有类问题比較常见,即矩阵的元素仅仅有0和1。 相应实际应用中的场景是:用户对新闻的点击情况,对某些物品的购买情况等。基于graphchi里面的矩阵分解结果不太理想。调研了下相关的文献,代码主要实现了基于PLSA的分解方法,具体请參考后面的參考文献 #!/usr/local/bin/p ...
分类:其他好文   时间:2017-06-13 09:57:16    阅读次数:208
《textanalytics》课程简单总结(2):topic mining
coursera上的公开课《https://www.coursera.org/course/textanalytics》系列,讲的很不错哦。 1、“term as topic”有非常多问题: 2、Improved Idea: Topic = Word Distribution: 3、定义问题(Pro ...
分类:其他好文   时间:2017-05-07 11:49:31    阅读次数:175
PLSA-概率潜语义分析(二)
PLSA最大化下面函数: 简化后,最大化下面函数: 。 —————————————————————————————————————————————————————————————————————————— 我们用期望最大值化算法(EM),求上述式子的最大值, 初始化: , E步:计算 。 (固定。, ...
分类:其他好文   时间:2017-04-22 14:49:50    阅读次数:194
主题模型——隐含狄利克雷分布总结
摘要:   1.算法概述   2.算法推导   3.算法特性及优缺点   4.注意事项   5.实现和具体例子   6.适用场合   7.与NB,pLSA比较 ...
分类:其他好文   时间:2017-04-01 12:22:48    阅读次数:322
主题模型——隐含狄利克雷分布总结
摘要:   1.算法概述   2.算法推导   3.算法特性及优缺点   4.注意事项   5.实现和具体例子   6.适用场合   7.与NB,pLSA比较 ...
分类:其他好文   时间:2017-03-21 12:57:07    阅读次数:547
话题模型-LDA学习
这篇文章很通俗易懂,转载的http://blog.sina.com.cn/s/blog_6622f5c301019d2s.html (一)LDA作用 传统判断两个文档相似性的方法是通过查看两个文档共同出现的单词的多少,如TF-IDF等,这种方法没有考虑到文字背后的语义关联,可能在两个文档共同出现的单 ...
分类:其他好文   时间:2017-03-18 21:12:26    阅读次数:268
55条   上一页 1 2 3 4 ... 6 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!