码迷,mamicode.com
首页 > 其他好文 > 详细

PCA主成分分析

时间:2018-12-06 20:37:45      阅读:205      评论:0      收藏:0      [点我收藏+]

标签:code   目的   import   gen   factor   depend   value   python   values   

主成分分析

PCA:principal component analysis
主成分分析是最常用的一种降维分析
目的:降低数据的复杂性,找到最有用的特征
降维:

  • PCA
  • FA 因子分析 factor analysis
  • ICA 独立成分分析 independent component analysis

PCA概述:
将数据从原来的坐标系转换到新的坐标系,新坐标的选择和数据本身相关。第一个新坐标轴是原数据中方差最大的方向,第二个坐标选择和第一个坐标正交且具有最大方差的方向。

数据最大方差方向

方差最大,就是数据差异性最大
计算协方差矩阵&特征值分析

特征值分析

\[A\nu=\lambda \nu\]
特征值\(\lambda\)和特征向量\(\nu\)
可以使用Numpy中linalg模块的eig()

numpy.linalg.eig(a)
# Compute the eigenvalues and right eigenvectors of a square array.

from numpy import linalg as LA
w, v = LA.eig(np.diag((1, 2, 3)))
w; v
"""
array([ 1.,  2.,  3.])
array([[ 1.,  0.,  0.],
       [ 0.,  1.,  0.],
       [ 0.,  0.,  1.]])
"""

PCA主成分分析

标签:code   目的   import   gen   factor   depend   value   python   values   

原文地址:https://www.cnblogs.com/GeekDanny/p/10078196.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!