自然语言的话题topic分析 非监督学习 使用NMF非负矩阵分解提取文章话题,NMF是在矩阵中所有元素均为非负数约束条件之下的矩阵分解方法(NMF的基本思想可以简单描述为:对于任意给定的一个非负矩阵A,NMF算法能够寻找到一个非负矩阵U和一个非负矩阵V,使得满足 ,从而将一个非负的矩阵分解为左右两个 ...
分类:
其他好文 时间:
2019-02-19 15:08:12
阅读次数:
267
一、使用非负最小二乘法 "Non negative matrix factorisation using non negative least squares" 问题 给定一个矩阵$A$,将其分解成两个非负的因子: $$ A_{M \times N} \approx W_{M \times K} \ ...
分类:
其他好文 时间:
2019-01-13 16:06:10
阅读次数:
177
在文本主题模型之潜在语义索引(LSI)中,我们讲到LSI主题模型使用了奇异值分解,面临着高维度计算量太大的问题。这里我们就介绍另一种基于矩阵分解的主题模型:非负矩阵分解(NMF),它同样使用了矩阵分解,但是计算量和处理速度则比LSI快,它是怎么做到的呢? 1. 非负矩阵分解(NMF)概述 非负矩阵分 ...
分类:
其他好文 时间:
2018-12-04 13:11:14
阅读次数:
273
NMF非负矩阵分解初探 简介 数据可以表示为一个矩阵 $V$,列 $v_n$ 是采样点而行代表特征features。我们想把这个矩阵$V$因式分解为两个未知的矩阵 $W$ 和 $H$ $$ V \approx \hat{V} \equiv WH$$ 这里面 $W$ 是一个经常性出现的patterns ...
分类:
其他好文 时间:
2018-07-05 16:03:17
阅读次数:
216
1、交叉验证 交叉验证(Cross validation),交叉验证用于防止模型过于复杂而引起的过拟合.有时亦称循环估计, 是一种统计学上将数据样本切割成较小子集的实用方法。 于是可以先在一个子集上做分析, 而其它子集则用来做后续对此分析的确认及验证。 一开始的子集被称为训练集。而其它的子集则被称为 ...
分类:
其他好文 时间:
2017-10-18 00:21:54
阅读次数:
142
一、矩阵分解回想 在博文推荐算法——基于矩阵分解的推荐算法中,提到了将用户-商品矩阵进行分解。从而实现对未打分项进行打分。矩阵分解是指将一个矩阵分解成两个或者多个矩阵的乘积。对于上述的用户-商品矩阵(评分矩阵),记为Vm×nV_{m\times n}。能够将其分解成两个或者多个矩阵的乘积,如果分解成 ...
分类:
编程语言 时间:
2017-08-10 10:06:09
阅读次数:
252
恢复内容开始 今天学习第一周的第二课时:降维。 一、PCA主成分分析 主成分分析(Principal Component Analysis,PCA),是一种统计方法,直观来讲是把数据按照weights来筛选出主成分消除(或者隐蔽)不太重要的方面,使得高纬度数据投射到低维度。 直观来讲是应用了统计学上 ...
分类:
其他好文 时间:
2017-05-21 18:44:54
阅读次数:
170
作者:桂。 时间:2017-04-14 06:22:26 链接:http://www.cnblogs.com/xingshansi/p/6685811.html 声明:欢迎被转载,不过记得注明出处哦~ 前言 之前梳理了一下非负矩阵分解(Nonnegative matrix factorization ...
分类:
编程语言 时间:
2017-04-15 14:38:55
阅读次数:
483
作者:桂。 时间:2017-04-13 07:43:03 链接:http://www.cnblogs.com/xingshansi/p/6702188.html 声明:欢迎被转载,不过记得注明出处哦~ 前言 前面分析了非负矩阵分解(NMF)的应用,总觉得NMF与谱聚类(Spectral cluste ...
分类:
其他好文 时间:
2017-04-13 20:20:25
阅读次数:
356
作者:桂。 时间:2017-04-07 07:11:54 链接:http://www.cnblogs.com/xingshansi/p/6679325.html 声明:欢迎被转载,不过记得注明出处哦~ 前言 最近发这类文章,动不动就被管理员从首页摘除,如果你觉得这个文章还说得过去,麻烦帮忙点个赞吧, ...
分类:
其他好文 时间:
2017-04-07 19:49:53
阅读次数:
1545