原文:http://dataunion.org/13451.html作者:xbinworld引言:机器学习领域中所谓的降维就是指采用某种映射方法,将原高维空间中的数据点映射到低维度的空间中。降维的本质是学习一个映射函数 f : x->y,其中x是原始数据点的表达,目前最多使用向量表达形式。 y是数据...
分类:
编程语言 时间:
2015-09-12 16:09:08
阅读次数:
272
版权声明: 本文由LeftNotEasy发布于http://leftnoteasy.cnblogs.com, 本文可以被全部的转载或者部分使用,但请注明出处,如果有问题,请联系wheeleast@gmail.com前言:第二篇的文章中谈到,和部门老大一宁出去outing的时候,他给了我相当多的机器学...
分类:
其他好文 时间:
2015-08-17 11:45:06
阅读次数:
174
版权声明: 本文由LeftNotEasy发布于http://leftnoteasy.cnblogs.com, 本文可以被全部的转载或者部分使用,但请注明出处,如果有问题,请联系wheeleast@gmail.com前言: 上一次写了关于PCA与LDA的文章,PCA的实现一般有两种,一种是用特征值分解...
分类:
其他好文 时间:
2015-08-17 11:42:50
阅读次数:
183
LDA, Linear Discriminant Analysis,线性判别分析。注意与LDA(Latent Dirichlet Allocation,主题生成模型)的区别。1、引入 上文介绍的PCA方法对提取样本数据的主要变化信息非常有效,而忽略了次要变化的信息。在有些情况下,次要信息可能正是把....
分类:
其他好文 时间:
2015-08-12 18:31:49
阅读次数:
2617
LDA(Latent Dirichlet Allocation)是一种文档主题生成模型,最近看了点资料,准备使用python实现一下。至于数学模型相关知识,某度一大堆,这里也给出之前参考过的一个挺详细的文档lda算法漫游指南这篇博文只讲算法的sampling方法python实现。完整实现项目开源py...
分类:
编程语言 时间:
2015-08-11 18:06:03
阅读次数:
137
淘宝的评论归纳是如何做到的? - 社交网络 - 知乎 社交网络 数据挖掘 自然语言处理 LDA 淘宝的评论归纳是如何做到的? 6 条评论 分享 按投票排序 按时间排序 9 个回答 什么是答案总结? 答案总结 .zm-item-answer"}" data-ini...
分类:
其他好文 时间:
2015-08-10 01:39:17
阅读次数:
577
http://cos.name/2013/03/lda-math-lda-text-modeling/5. LDA 文本建模5.1 游戏规则对于上述的 PLSA 模型,贝叶斯学派显然是有意见的,doc-topic 骰子θ→m和 topic-word 骰子φ→k都是模型中的参数,参数都是随机变量,怎么...
分类:
其他好文 时间:
2015-08-02 23:18:20
阅读次数:
190
http://cos.name/2013/03/lda-math-text-modeling/4. 文本建模我们日常生活中总是产生大量的文本,如果每一个文本存储为一篇文档,那每篇文档从人的观察来说就是有序的词的序列d=(w1,w2,?,wn)。包含M篇文档的语料库统计文本建模的目的就是追问这些观察到...
分类:
其他好文 时间:
2015-08-02 23:17:24
阅读次数:
314
http://cos.name/2013/01/lda-math-mcmc-and-gibbs-sampling/3.1 随机模拟随机模拟(或者统计模拟)方法有一个很酷的别名是蒙特卡罗方法(Monte Carlo Simulation)。这个方法的发展始于20世纪40年代,和原子弹制造的曼哈顿计划密...
分类:
其他好文 时间:
2015-08-02 23:14:30
阅读次数:
349
http://cos.name/2013/01/lda-math-beta-dirichlet/#more-69532. 认识Beta/Dirichlet分布2.1 魔鬼的游戏—认识Beta 分布统计学就是猜测上帝的游戏,当然我们不总是有机会猜测上帝,运气不好的时候就得揣度魔鬼的心思。有一天你被魔鬼...
分类:
其他好文 时间:
2015-08-02 23:09:04
阅读次数:
182