标签:
我们知道主成分分析是一种降维方法,但是其本质上只是一种矩阵变换的过程,提取出来的主成分并不都具有实际含义,而这种含义往往是我们所需要的,接下来的因子分析可以解决这个问题
因子分析可以看做是主成分分析的推广,而主成分分析也可以看做是因子分析中提取因子的一种方法,二者很多时候非常相像,但是也有一些不同,二者最直接的不同是主成分分析的结果唯一的,但是因子分析不是,因此我们可以通过因子旋转,对因子载荷做进一步简化,使每个因子都有明确的实际意义,这也是评价因子分析最终是否成功的关键。
主成分分析对于数据并没有过多要求,而因子分析的适用条件是:
1.样本量不能太小
因子分析是考量变量间的内部关联结构,因此样本量要尽量充足
2.各变量之间应该具有相关性
需要通过bartlett检验,如果变量间彼此独立,则无法从中提取因子,也就无法使用因子分析
3.变量间的偏相关性应该强一些
可以通过KMO值度量,该值越大,说明变量间的偏相关性越强,因子分析效果越好
我们还是用主成分分析的那个例子,做因子分析,看看二者的异同。
分析—降维—因子分析
到此,我们得到了最终的因子得分,并保存为变量,可以进一步计算总和因子得分,以此来对城市进行综合排名。
标签:
原文地址:http://www.cnblogs.com/xmdata-analysis/p/5658773.html