标签:python plain hit bsp import ram 数据 new ack
使用sklearn库中的PCA类进行主成分分析。
导入要用到的库,还没有的直接pip安装就好了。
from sklearn.decomposition import PCA
import numpy as np # 如果使用numpy的array作为参数的数据结构就需要,其他type没试过是否可以
import pandas as pd # 非必要
PCA类的主要输入参数有以下几个:
除了这些输入参数外,有两个PCA类的成员值得关注。
第一个是explained_variance_,它代表降维后的各主成分的方差值。方差值越大,则说明越是重要的主成分。
第二个是explained_variance_ratio_,它代表降维后的各主成分的方差值占总方差值的比例,这个比例越大,则越是重要的主成分。
由于我的数据是放在dataframe的数据结构里的,所以我先把它提取出来转换成numpy的array。
X_pca=all.loc[:,emotion]
X_pca=np.array(X_pca)
a=PCA(n_components=3) # 设置降维后的特征数目
a.fit(X_pca) # 传入我们的数据
X_new=a.transform(X_pca) # 得到降维后的新数据,仍然是numpy的array形式
print(a.explained_variance_ratio_) # 查看降维后的各主成分的方差值占总方差值的比例
print(a.explained_variance_) #查看降维后的各主成分的方差值
标签:python plain hit bsp import ram 数据 new ack
原文地址:https://www.cnblogs.com/IvyWong/p/9482656.html