码迷,mamicode.com
首页 > 其他好文 > 详细

数据挖掘算法学习(四)PCA算法

时间:2014-07-29 14:32:48      阅读:196      评论:0      收藏:0      [点我收藏+]

标签:数据挖掘   主元分析法   pca   

算法简介

主成分分析(PrincipalComponentAnalysis,简称PCA)一种常用的基于变量协方差矩阵对信息进行处理、压缩和抽提的有效方法主要用于对特征进行降维。

算法假设

数据的概率分布满足高斯分布或是指数型的概率分布。方差高的向量视为主元。

算法输入

包含n条记录的数据集

算法输出

降维或压缩后的数据集

算法思想

?1.计算所有样本的均值m协方差矩阵S
?2.计算S的特征值大到小排序;
?3.选择前n‘个特征值对应的特征矢量作成一个变换矩阵E=[e1,e2, …, en’]
?4.最后,对于之前每一个n维的特征矢量x可以转换为n’维的新特征矢量

    y=transpose(E)(x-m)

weka运行结果

以weather.nominal.arff为例运行结果部分截图如下:

bubuko.com,布布扣

算法应用

人脸识别

图像压缩

信号去噪


原创文章,转载请注明出处,谢谢。





数据挖掘算法学习(四)PCA算法,布布扣,bubuko.com

数据挖掘算法学习(四)PCA算法

标签:数据挖掘   主元分析法   pca   

原文地址:http://blog.csdn.net/iemyxie/article/details/38236647

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!