标签:公式 技术 说明 原来 特征 概率 转换 ann 均值
PCA是用来给多维数据降维,分析提取主成分的一种算法;
怎么实现的呢?首先说明,在已标注和未标注的数据上都有降维技术,PCA是一种在对未标注数据的降维技术。
在PCA中,数据从原来的坐标系转换到了新的坐标系,新坐标系的选择是由数据本身决定的。第一个新坐标轴选择的是原始数据中方差最大的方向,第二个新坐标轴的选择和第一个坐标轴正交且具有最大方差的方向。该过程一直重复,重复次数为原始数据中特征的数目。我们会发现,大部分方差都包含在最前面的几个新坐标轴中。因此,我们可以忽略余下的坐标轴,即对数据进行了降维处理。
需要掌握的相关概率知识:协方差的意义和计算公式(包含均值、方差、标准差)
主成成分分析-PCA(principal component annlysis)
标签:公式 技术 说明 原来 特征 概率 转换 ann 均值
原文地址:https://www.cnblogs.com/go-ahead-wsg/p/13926460.html