码迷,mamicode.com
首页 > 其他好文 > 详细

SPSS数据分析—最优尺度回归

时间:2016-07-02 18:58:19      阅读:205      评论:0      收藏:0      [点我收藏+]

标签:

在之前介绍的线性回归模型中,有一个隐含的假设是自变量均为连续变量,但实际上自变量有时候是分类变量,类似于方差分析中的因素,这种分类自变量在回归分析中,也默认作为连续变量使用,这就会产生一个问题,如果是无序分类变量,那么各类别间没有高低之分,每变化一个单位,对于因变量的影响是相同的,无法分析当中的趋势,虽然可以使用哑变量,但是当分类变量过多或每个变量的类别水平过多时,这种方法非常繁琐,此外,当类别较多时,可能会存在某几个类别对因变量的作用相似,这是可分析的点,但是传统线性模型却将此信息忽略,造成信息浪费。如果是有序分类变量,那么变量编码代表变量的高低顺序,这对于因变量的影响是不同的,而传统线性模型仍然忽略此信息,有可能会导致错误的分析结论。

基于以上问题,统计学家研究出了最优尺度变换这一方法,专门用于解决建模时如何对分类变量进行量化的问题。基本思想是基于希望拟合的模型框架,在保证各自变量间的联系为线性的前提下,通过一定的方法进行反复迭代,为原始分类变量找到一个最佳的量化评分,用这个评分代替原始变量进行后续的分析,这样一来,不仅仅是回归分析,任何包含分类自变量的分析方法都将适用于此,大大扩展了分析方法的适用范围。

最优尺度变换用于回归分析中,就是最优尺度回归,具体过程为

分析—回归—最佳尺度

本例中,我们想分析年龄、居住地、受教育程度对于子女数的影响,这里面年龄为连续变量,居住地为两分类变量、受教育程度为有序分类变量,从数据情况来看,自变量类型比较杂,年龄和居住地可以直接纳入模型分析,受教育程度可以设置哑变量形式引入模型,但是这样一来,相当于把该变量分散开,无法作为一个完整的变量进行分析了,在此,我们使用最优尺度回归。
技术分享
技术分享
技术分享

以上结果都是将变量进行最优尺度变换之后的回归分析结果,那么如何查看变量的变换情况呢?该过程同时提供了转换图可供参考,点击绘制按钮设置即可


技术分享

技术分享
技术分享

SPSS数据分析—最优尺度回归

标签:

原文地址:http://www.cnblogs.com/xmdata-analysis/p/5635722.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!