码迷,mamicode.com
首页 > 其他好文 > 详细

主成分分析法(PCA)答疑

时间:2014-12-08 00:34:02      阅读:303      评论:0      收藏:0      [点我收藏+]

标签:数据   时间   br   ca   ld   需要   没有   过程   移动   

问:为什么要去均值?

1、我认为归一化的表述并不太准确,按统计的一般说法,叫标准化。数据的标准化过程是减去均值并除以标准差。而归一化仅包含除以标准差的意思或者类似做法。
2、做标准化的原因是:减去均值等同于坐标的移动,把原始数据点的重心移到和原点重合,这样利于很多表达,比如数据的协方差矩阵可以写成XX‘,若没有减去均值,则XX‘后面还要减去一些东西(还不明白可以参考多元统计分析的书)。除以标准差是为了统一并消除量纲。一个矩阵中有多个向量,有些可能表示了长度,有些表示了重量,除以标准差,才能让它们仅以“数”的概念一起比较运算。
3、标准化的做法。举例,若你的矩阵A是5行3列,第一列表示长度,第二列表示时间,第三列表示质量,那么矩阵A等同于对这个三个量进行了5次测量,所以5*3.这样3个分量有各自的均值和标准差,对这个矩阵中15个元素均做标准化只要减去长度、时间、质量各自的均值并除以标准差即可。

4、图像不需要除以标准差,因为他们都是像素值,同量纲同尺度。只减均值就行。

主成分分析法(PCA)答疑

标签:数据   时间   br   ca   ld   需要   没有   过程   移动   

原文地址:http://www.cnblogs.com/yyxayz/p/4150170.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!