国际权威学术组织the IEEE International Conference on Data Mining (ICDM) 2006年12本月十大评选经典的数据挖掘算法:C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaBoost, kNN, Naive...
分类:
编程语言 时间:
2015-06-23 15:09:58
阅读次数:
107
国际权威学术组织the IEEE International Conference on Data Mining (ICDM) 2006年12本月十大评选经典的数据挖掘算法:C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaBoost, kNN, Naive...
分类:
编程语言 时间:
2015-06-22 19:11:57
阅读次数:
189
PCA算法算法步骤:
假设有m条n维数据。
1. 将原始数据按列组成n行m列矩阵X
2. 将X的每一行(代表一个属性字段)进行零均值化,即减去这一行的均值
3. 求出协方差矩阵C=1/mXXT
4. 求出协方差矩阵的特征值以及对应的特征向量
5. 将特征向量按对应特征值大小从上到下按行排列成矩阵,取前k行组成矩阵P
6. Y=PX即为降维到k维后的数据实例
以这个为例,我们用PCA...
分类:
编程语言 时间:
2015-06-20 10:38:22
阅读次数:
448
降维(一)----说说主成分分析(PCA)的源头降维系列:降维(一)----说说主成分分析(PCA)的源头降维(二)----Laplacian Eigenmaps---------------------主成分分析(PCA)在很多教程中做了介绍,但是为何通过协方差矩阵的特征值分解能够得到数据的主成分...
分类:
其他好文 时间:
2015-06-19 21:29:49
阅读次数:
199
降维(二)----Laplacian Eigenmaps降维系列:降维(一)----说说主成分分析(PCA)的源头降维(二)----Laplacian Eigenmaps---------------------前一篇文章中介绍了主成分分析。PCA的降维原则是最小化投影损失,或者是最大化保留投影后数...
分类:
其他好文 时间:
2015-06-19 21:29:35
阅读次数:
198
栈式自动编码器(Stacked AutoEncoder)起源:自动编码器单自动编码器,充其量也就是个强化补丁版PCA,只用一次好不过瘾。于是Bengio等人在2007年的 Greedy Layer-Wise Training of Deep Networks中,仿照stacked RBM构成的DBN...
分类:
Web程序 时间:
2015-06-19 20:15:59
阅读次数:
360
降噪自动编码器(Denoising Autoencoder)起源:PCA、特征提取....随着一些奇怪的高维数据出现,比如图像、语音,传统的统计学-机器学习方法遇到了前所未有的挑战。数据维度过高,数据单调,噪声分布广,传统方法的“数值游戏”很难奏效。数据挖掘?已然挖不出有用的东西。为了解决高维度的问...
分类:
Web程序 时间:
2015-06-19 20:08:51
阅读次数:
11767
一、算法1、kNN算法又称为k近邻分类(k-nearest neighbor classification)算法。最简单平庸的分类器或许是那种死记硬背式的分类器,记住全部的训练数据,对于新的数据则直接和训练数据匹配,假设存在同样属性的训练数据,则直接用它的分类来作为新数据的分类。这样的方式有一个明显...
分类:
编程语言 时间:
2015-06-18 13:13:58
阅读次数:
147
PRML学习笔记:特征值分解、奇异值分解与 PCA
分类:
其他好文 时间:
2015-06-17 13:08:27
阅读次数:
217
Reference:http://licstar.net/archives/328 (比较综合的词向量研究现状分析)起源:One-hot Representation、PCA序:为什么NLP在模式识别里面比较难?Licstar的文章开头这么提到:语言(词、句子、篇章等)属于人类认知过程中产生的高层认...
分类:
其他好文 时间:
2015-06-12 22:01:12
阅读次数:
21115