码迷,mamicode.com
首页 > 其他好文 > 详细

《The Elements of Statistical Learning》 chp3 Linear Models for Regression

时间:2017-04-15 15:31:43      阅读:111      评论:0      收藏:0      [点我收藏+]

标签:err   stat   3.2   方法   ade   rss   lin   span   orm   

  • 3.1    线性回归模型假定 回归函数E(Y|X)与输入X1,...,Xp是线性关系。 ## 可以扩展到与 输入的变换 是线性关系,这种扩展叫做 basis-function methods(基函数方法) ,在Chp5 中讨论。  
  • 3.2    输入变量可以是 1.输入的Xj  2.输入的变换,如取对数、开方等  3. basis expansions,如X2=X1的平方,X3=X1的三次方,变成了多项式表示  4. dummy coding  5.interaction between variables,比如:X3=X1*X2。  ## 总之,模型关于参数是线性的。   ##   RSS(the residual sum of squares) ##   最小二乘的预测y-hat 是y在输入X生成的列空间上的正交投影  ##若X的列不是相互独立的,软件可以将某些列删掉 ##  Rank deficiencies 输入变量p大于训练样本数  ##参数估计值Beta-hat的方差 ##对单个系数进行假设检验,t检验&对多个系数进行显著性检验,F检验     null hypothesis指零假设、原假设  ##  Example: Prostate Cancer,base error rate                                                                                                                                                                                                                             ##the Gauss-Markov Theorm,最小二乘估计出的Beta在所有线性无偏估计中有最小的方差,而ridge regression 是有偏估计。但是可能存在有偏估计量有更小的方差,bias-variance tradeoff。比如:将最小二乘中一些系数设置为0可能会得到一个有偏估计。

《The Elements of Statistical Learning》 chp3 Linear Models for Regression

标签:err   stat   3.2   方法   ade   rss   lin   span   orm   

原文地址:http://www.cnblogs.com/terryhaha/p/6714325.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!