算法简介
主成分分析(PrincipalComponentAnalysis,简称PCA)是一种常用的基于变量协方差矩阵对信息进行处理、压缩和抽提的有效方法。主要用于对特征进行降维。
算法假设
数据的概率分布满足高斯分布或是指数型的概率分布。方差高的向量视为主元。
算法输入
包含n条记录的数据集
算法输出
降维或压缩后的数据集
算法思想
y=transpose(E)(x-m)
weka运行结果
以weather.nominal.arff为例运行结果部分截图如下:
算法应用
人脸识别
图像压缩
信号去噪
原创文章,转载请注明出处,谢谢。
数据挖掘算法学习(四)PCA算法,布布扣,bubuko.com
原文地址:http://blog.csdn.net/iemyxie/article/details/38236647