主成分分析(principal component analysis)是一种常见的数据降维方法,其目的是在“信息”损失较小的前提下,将高维的数据转换到低维,从而减小计算量。这里的“信息”指的是数据所包含的有用的信息。 主要思路:从原始特征中计算出一组按照“重要性”从大到小排列的新特征,它们是原始特征
分类:
编程语言 时间:
2016-03-03 22:45:12
阅读次数:
264
转载地址:http://www.cnblogs.com/jerrylead/archive/2011/04/18/2020209.html 1. 问题 真实的训练数据总是存在各种各样的问题: 1、 比如拿到一个汽车的样本,里面既有以“千米/每小时”度量的最大速度特征,也有“英里/小时”的最大速度特征
分类:
其他好文 时间:
2016-02-13 21:54:39
阅读次数:
328
原文地址链接 1. 问题 真实的训练数据总是存在各种各样的问题: 1、 比如拿到一个汽车的样本,里面既有以“千米/每小时”度量的最大速度特征,也有“英里/小时”的最大速度特征,显然这两个特征有一个多余。 2、 拿到一个数学系的本科生期末考试成绩单,里面有三列,一列是对数学的兴趣程度,一列是复习时间,
分类:
其他好文 时间:
2016-01-31 21:25:00
阅读次数:
310
原文:http://www.cnblogs.com/leonwen/p/5158947.html 该算法由MatLab移植而来(具体参见上一篇博文)。但是最终输出结果却和MatLab不一致,经排查发现在进行调用两者内部函数eig进行求解特征值和特征向量的时候,两者特征值都一致,但是特征向量却不...
分类:
编程语言 时间:
2016-01-26 00:08:41
阅读次数:
322
斯坦福ML公开课笔记15我们在上一篇笔记中讲到了PCA(主成分分析)。PCA是一种直接的降维方法。通过求解特征值与特征向量,并选取特征值较大的一些特征向量来达到降维的效果。本文继续PCA的话题,包含PCA的一个应用——LSI(Latent Semantic Indexing, 隐含语义索引)和PCA...
分类:
其他好文 时间:
2016-01-24 16:50:21
阅读次数:
197
经过了2个月对机器学习的了解后。我发现了,机器学习的方向多种多样。网页排序。语音识别,图像识别,推荐系统等。算法也多种多样。看见其它的书后,我发现除了讲到的k均值聚类。贝叶斯,神经网络,在线学习等等,还有非常多其它的算法。比方说:免疫算法,遗传算法,主成分分析。蚁群算法等等。好像非常多算法都是须要....
分类:
其他好文 时间:
2016-01-13 23:20:45
阅读次数:
304
数据说明:采用的数据源是从别人那里拷的2012年全年的Sea Surface Temperature(海标温度,SST)数据,一直想找一份比较好的主成分分析数据,也没找到。Matlab自身有主成分分析的函数princomp,其中返回的第二个数据就是样本经过K-L变换后的各个成分数据,第三个参数就是特...
分类:
其他好文 时间:
2016-01-11 23:45:13
阅读次数:
363
版权声明: 本文由LeftNotEasy发布于http://leftnoteasy.cnblogs.com, 本文可以被全部的转载或者部分使用,但请注明出处,如果有问题,请联系wheeleast@gmail.com前言:第二篇的文章中谈到,和部门老大一宁出去outing的时候,他给了我相当多的机器学...
分类:
其他好文 时间:
2016-01-03 19:34:50
阅读次数:
215
问题1、 比如拿到一个汽车的样本,里面既有以“千米/每小时”度量的最大速度特征,也有“英里/小时”的最大速度特征,显然这两个特征有一个多余。2、 拿到一个数学系的本科生期末考试成绩单,里面有三列,一列是对数学的兴趣程度,一列是复习时间,还有一列是考试成绩。我们知道要学好数学,需要有浓厚的兴趣,所以第...
分类:
其他好文 时间:
2015-12-29 15:58:51
阅读次数:
190
广义上讲,任何在学习过程中应用到矩阵特征值分解的方法均叫做谱学习方法,比如主成分分析(PCA),线性判别成分分析(LDA),流形学习中的谱嵌入方法,谱聚类等等。 由于科苑向世明老师课件上面关于ng的谱聚类算法里面与ng大神的论文中写到的算法中有所出入,导致昨天晚上调了一晚上的算法并没有调出满...
分类:
编程语言 时间:
2015-12-28 00:47:42
阅读次数:
407