码迷,mamicode.com
首页 > 其他好文 > 详细

对于PCA的认识

时间:2015-03-09 20:39:57      阅读:166      评论:0      收藏:0      [点我收藏+]

标签:

  PCA(Principal component analysis)是一种多元统计方法。最近在研究PCA在故障检测上的运用。在这里说说我对PCA的认识。

  首先,我们需要有一组数据X,X是n行m列的数据,为了方便,我们认为数据是均值为0,方差为1的数据。其中n为样本数,m为变量。我们可以找到一个线性组合T=XP,其中T=(t1,t2,...,tm)(T为Rn*m),P=(p1,p2,...,pm)(p为Rm*m)。

其中使得 (1)ti和tj线性无关。

    (2)t1是使X一切线性组合中方差最大的,t2是使满足(1)后X一切线性组合中方差最大的。。。

    (3)ti=Xpi的系数满足piTpi=1.

 

其实,以上三个要求就是将原数据进行平移旋转,但是也不能随意的旋转,我们需要找个一组坐标系,使得我们的数据在这个新的坐标系上能有最清晰的反应。这个指标就是方差,我们需要找到一组使这组数据方差最大的一个坐标系,然后找到这个坐标系之后,我们选取其方向的单位向量来表示这个坐标系。

 

  这个新的坐标系的具体求解方法如下:

(1)将数据X中心化((x-u)/std(x)),得到新的数据仍然用X表示。

(2)计算X的协方差矩阵∑=XT*X。并对其进行特征值分解,得到特征值Λ‘,和对应的特征向量矩阵P‘。然后我们对特征值按其大小按从大到小排序,对应的特征向量也进行排序得到Λ和P,就找到满足条件的坐标系。

 

以上是坐标系的变换,但PCA不仅仅如此。PCA可以在一定置信度下,将高维数据用较少维数的数据表示,也就是降维的功能。下面来解释。

对于PCA的认识

标签:

原文地址:http://www.cnblogs.com/tqianly/p/4324216.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!