码迷,mamicode.com
首页 > 其他好文 > 详细

【机器学习实战】多元线性回归模型

时间:2014-09-02 01:35:34      阅读:189      评论:0      收藏:0      [点我收藏+]

标签:机器学习   数据挖掘   多元线性回归   

在许多实际问题中,影响因变量Y的自变量不止一个,通常设为p个,此时无法借助于图形的帮助来确定模型,这里则使用一种最为简单且普遍的模型——多元线性模型来进行回归计算。


1、数学模型


当影响Y值的因素不唯一时,我们可以使用多元线性回归模型:

bubuko.com,布布扣

当未知参数有两个时,我们可以画出此方程的图形表示(此时是一个平面,如图)。如果未知数大于2时,则很难把此超平面给画出来。

bubuko.com,布布扣

如上图,为了求得bubuko.com,布布扣等参数的值,我们由各个样本点(图中为红点)做一条平行于Y轴的直线,此直线交平面方程于一点,然后我们求得此线段的程度,并进行平方,最后将所有的这些线段的平方和加到一起,得到残差平方和,公式如下:

bubuko.com,布布扣

当残差平方和最小时,此线性回归达到最好,所以这里用RSS分别对bubuko.com,布布扣等进行求偏导,得到一个m+1方程组,从而可以求得bubuko.com,布布扣等的值,即可得到对应的线性回归方程。


2、R回归建模


在R中提供了一个内置的数据集Swiss,这个数据时瑞士1888年影响国民经济的各个因素数据,关于此数据的具体介绍,可以在R中输入help(swiss)进行了解,或者直接访问http://stat.ethz.ch/R-manual/R-patched/library/datasets/html/swiss.html进行了解,swiss的部分数据如下:

bubuko.com,布布扣

下面我们就做一下Fertility和Agriculture、Examination、Education、Catholic、Infant.Mortality五个参数之间的回归模型。


使用R的回归函数lm进行回归如下:

bubuko.com,布布扣


通过summary函数查看回归结果:

bubuko.com,布布扣

此时的P值非常小,我们可以得知此模型的正确性很高。从* 的个数来看,Examination的几乎没有相关度,所以后续可以考虑将此参数去掉。



【机器学习实战】多元线性回归模型

标签:机器学习   数据挖掘   多元线性回归   

原文地址:http://blog.csdn.net/wukongcode/article/details/38990447

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!