码迷,mamicode.com
首页 > 其他好文 > 详细

2015.8.17 PCA

时间:2016-05-13 02:36:08      阅读:141      评论:0      收藏:0      [点我收藏+]

标签:

PCA

最大化单个维度的区分性,减少维度之间的影响。
区分性度量:方差
维度之间影响:协方差
因此用矩阵表示之后就是协方差矩阵的特征值和特征向量。
1.构造矩阵。
2.求出矩阵的协方差矩阵。
3.求出协方差矩阵的特征值和特征向量,即在这些方向上不变。
4.选出其中的几个方向能够比较完整表示所有的向量。
5.计算在新坐标轴上的坐标

ref:
http://www.cnblogs.com/CBDoctor/archive/2011/10/29/2228756.html
协方差矩阵——PCA的关键。 
   PCA的目的就是“降噪”和“去冗余”。“降噪”的目的就是使保留下来的维度间的相关性尽可能小,而“去冗余”的目的就是使保留下来的维度含有的“能量”即方差尽可能大。那首先的首先,我们得需要知道各维度间的相关性以及个维度上的方差!那有什么数据结构能同时表现不同维度间的相关性以及各个维度上的方差呢?自然是非协方差矩阵莫属。回忆下《浅谈协方差矩阵》的内容,协方差矩阵度量的是维度与维度之间的关系,而非样本与样本之间。协方差矩阵的主对角线上的元素是各个维度上的方差(即能量),其他元素是两两维度间的协方差(即相关性)。我们要的东西协方差矩阵都有了,先来看“降噪”,让保留下的不同维度间的相关性尽可能小,也就是说让协方差矩阵中非对角线元素都基本为零。达到这个目的的方式自然不用说,线代中讲的很明确——矩阵对角化。而对角化后得到的矩阵,其对角线上是协方差矩阵的特征值,它还有两个身份:首先,它还是各个维度上的新方差;其次,它是各个维度本身应该拥有的能量(能量的概念伴随特征值而来)。这也就是我们为何在前面称“方差”为“能量”的原因。也许第二点可能存在疑问,但我们应该注意到这个事实,通过对角化后,剩余维度间的相关性已经减到最弱,已经不会再受“噪声”的影响了,故此时拥有的能量应该比先前大了。看完了“降噪”,我们的“去冗余”还没完呢。对角化后的协方差矩阵,对角线上较小的新方差对应的就是那些该去掉的维度。所以我们只取那些含有较大能量(特征值)的维度,其余的就舍掉即可。PCA的本质其实就是对角化协方差矩阵.
 PCA的本质是对角化协方差矩阵,目的是让维度之间的相关性最小(降噪),保留下来的维度的能量最大(去冗余)。

http://www.cnblogs.com/zh  ngchaoyang/articles/2222048.html

http://www.cnblogs.com/tornadomeet/archive/2012/12/30/2839615.html
matlab

2015.8.17 PCA

标签:

原文地址:http://blog.csdn.net/zhaohui1995_yang/article/details/51346684

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!