标签:com www. 不同的 err html ref python 不同 自己
主要的步骤:
转载至:http://www.cnblogs.com/chenbjin/p/4200790.html?utm_source=tuicool&utm_medium=referral
1.数据中心化,均值为0,方差为1(目的:协方差矩阵表示的为方差,方差为1,消除量纲影响(由于最大化方差,主要针对量纲不同的数据),即为标准化)
2.求取xx的特征值和特征向量
3.排序特征值,进行筛选,从而筛选出相应的特征向量
4.标准化后数据乘以选出的特征向量(从而原始数据映射到低维度的空间)
5.为了将原始数据与降维后的数据进行比较,所以将降维后数据乘以选取的特征向量的逆+均值(如果前期是标准化的则应该乘以方差+均值),从而得到可以与原始数据进行对比的降维后的数据(选取了部分的特征)
特征向量表示映射的维度,特征值表示矩阵在特征向量方向下的拉伸大小,则可以理解为在该维度下的方差大小。或者按照力的分解的方式进行理解(自己理解的),特征值为在相应方向上(特征向量方向)力的大小。
sklearn中的PCA的调用:
http://blog.csdn.net/u012162613/article/details/42192293
标签:com www. 不同的 err html ref python 不同 自己
原文地址:http://www.cnblogs.com/liuting1990/p/7783866.html