标签:web list 大小 算法理解 The margin none 关系 bsp
设原始数据矩阵X对应的协方差矩阵为C,而P是一组基按行组成的矩阵,设Y=PX,则Y为X对P做基变换后的数据。设Y的协方差矩阵为D,我们推导一下D与C的关系:而对于协方差矩阵来说,一定可以找到n个单位正交特征向量,将其按列组成矩阵E 爱上ANKI则有,所以推得注意:在C(原始数据对应的的协方差矩阵)中,体现的是数据映射在X轴和Y轴的方差以及协方差,在新的协方差矩阵里,体现的是数据映射到2个特征向量的方差以及协方差。
算法 | 实例 |
---|---|
1)将原始数据按列组成n行m列矩阵X 将每组数据写成一列一列的,是因为要实现投影,参考见5)和6) | 将这组二维数据降到一维 |
2)将X的每一行(代表一个属性字段)进行零均值化,即减去这一行的均值(意义参考见机器学习中的数学→数理统计→数字特征和统计量→协方差和样本协方差→协方差矩阵) | 这个矩阵的每行已经是零均值 ,所以可以看到这些点在原点周围 |
3)求出协方差矩阵 | |
4)求出协方差矩阵的特征值及对应的特征向量 | 标准化后为: P是标准化后的特征向量的转秩: |
5)将特征向量按对应特征值大小从上到下按行排列成矩阵,取前k行组成矩阵P,取行数是因为
| 取P的第一行: |
6)Y=PX即为降维到k维后的数据 | |
7)可视化一下降维的结果 |
标签:web list 大小 算法理解 The margin none 关系 bsp
原文地址:https://www.cnblogs.com/LeisureZhao/p/9754604.html