码迷,mamicode.com
首页 > 其他好文 > 详细

机器学习第2周---炼数成金-----线性回归与Logistic

时间:2016-04-23 18:05:57      阅读:340      评论:0      收藏:0      [点我收藏+]

标签:

重点归纳

回归分析就是利用样本(已知数据),产生拟合方程,从而(对未知数据)迚行预测
用途:预测,判别合理性
例子:利用身高预测体重;利用广告费用预测商品销售额;等等.
线性回归分析:一元线性;多元线性;广义线性
非线性回归分析
困难:选定变量(多元),避免多重共线性,观察拟合方程,避免过度拟合,检验模型是否合理

相关系数

技术分享

 

一元线性回归模型

如何确定参数

使用平方误差和衡量预测值不真实值的差距
平方误差真实值y,预测值,则平方误差就是技术分享
寻找合适的参数,使得平方误差和技术分享最小。

 

最小二乘法:技术分享

RSS其实是关于α不β的函数,分别对α不β求偏导并令偏导等于0,就可以得出α不β的值

技术分享

 

由于总体未知,采用样本值估计:

技术分享

 

 

一元线性回归分析

 

多元线性回归模型

多元线性回归的核心问题:应该选择哪些变量?
一个非典型例子(薛毅书p325)
RSS(残差平方和)与R2(相关系数平方)选择法:遍历所有可能的组合选出使RSS最小,R2最大的模型
AIC(Akaike information criterion)准则不BIC(Bayesian information criterion)准则
AIC=n ln (RSSp/n)+2p
n为变量总个数,p为选出的变量个数,AIC越小越好

逐步回归
向前引入法:从一元回归开始,逐步增加变量,使指标值达到最优为止
向后剔除法:从全变量回归方程开始,逐步删去某个变量,使指标值达到最优为止
逐步筛选法:综合上述两种方法

 

广义线性模型

Logit变换

技术分享

常见连接函数不逆连接函数

技术分享

 

机器学习第2周---炼数成金-----线性回归与Logistic

标签:

原文地址:http://www.cnblogs.com/hellochennan/p/5424879.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!