标签:
在做logistics回归之前,我们要先对你要做预测的变量做个相关分析,找出和你因变量相关的自变量。我这里就不做了,直接用我处理之后的数据。
打开我们要分析的数据,单击“分析”,选择“回归”,然后选择“二元Logistics回归”,弹出下面的界面,如图:
把是否购买移到因变量框里面去,把消费金额和消费数量移动到协变量框里面去,然后单击“保存”按钮,弹出“Logistics回归:保存”界面,选择“预测值”下面的“概率”,之后咋爱单击浏览按钮,把模型保存到你想保存的位子,完成之后单击“继续”,回到刚刚的那个界面之后单击“确定”按钮,就进行了“Logistics回归分析”了。
它会在你原始的数据表格里面新增加一列数据,这个就是那个事件发生的概率值,在二元Logistics回归里面,结果是用概率值来表示的,但是在0到0.5表示的就是不发生;0.5到1表示的就是发生。
二元Logistics回归分析结果最重要的就是下面那张表格:方程式中的变量
表格里面的第二列就是回归方程的系数,写成回归方程就是:
logit(P) = 0.01*消费金额+(-2.725)*消费数量
“常量”因为显著性为0.881大于0.05,所以可以说影响力小,可以忽略,加进去也可以(那个常量我问下别人,都说可以忽略,但是不敢确定,怕万一就加进去试一下,对比下结果)。
接下来就是用已经建立好的模型来做预测
打开你要预测的数据,然后单击“实用程序”,选择“评分向导”,浏览你刚刚保存模型的地址,有几个要注意的地方,直接看图:
接下来直接就是下一步下一步就可以了,然后单完成,它会在你要预测的数据表里面新增加一列数据,也就是预测结果。
这样我们的二元Logistics回归预测也就结束了。
注意:
1、在这里我只是进行了简单的二元Logistics回归分析,也就是说因变量只有两个:是和否,发生或者不发生,其实还有因变脸多种情况的,比如:高、低和中三种情况的。
2、还有就是在这里也没有进行变量的处理,如果你的数据有很多的变量你肯定是要先进行降维的,我这里只是根据我之前的一些数据进行的分析,没有具体做那些预备工作的。
标签:
原文地址:http://www.cnblogs.com/114811yayi/p/5690089.html