码迷,mamicode.com
首页 > 其他好文 > 详细

logistic公式形式的由来,从广义线性回归说起

时间:2014-12-11 01:29:30      阅读:238      评论:0      收藏:0      [点我收藏+]

标签:style   http   ar   sp   for   问题   log   bs   ef   

普通线性回归的形式为:bubuko.com,布布扣(之所以这么写是因为bubuko.com,布布扣的线性才是线性的所指)

线性回归模型有一下以下几个特征:

1.bubuko.com,布布扣

2.x,y 通常取值连续

3.y的分布为正态分布或接近正态。

广义线性模型进行了如下推广:

1.bubuko.com,布布扣,h为严格单调充分光滑已知函数。bubuko.com,布布扣(h的反函数)称为联系函数。bubuko.com,布布扣;

2.x,y可去连续或离散值,离散值比较常见。

3.y的分布推广到指数型分布,正态是其特例。 y的密度形式:

bubuko.com,布布扣

b(·) ,c(·)为已知函数,bubuko.com,布布扣为自然参数,bubuko.com,布布扣为额外参数或散布参数。

 此时可以证明,bubuko.com,布布扣b上面加一点表示b的一阶导数,两点代表其二阶导数。

 

  (y1,y2,y3,y4...)的联合分布函数(似然函数)为:

bubuko.com,布布扣

其中,因为bubuko.com,布布扣

 

所以bubuko.com,布布扣刚好等于h的反函数时(h=·b),该似然函数有最简单形式:

 

bubuko.com,布布扣

 

  

下面我们对二分类(0-1,logic)问题进行讨论:

对于 y=f(x),y的取值为只有0 1的问题,

bubuko.com,布布扣,y的密度表达式为bubuko.com,布布扣 ,若要写成指数形式,经推导,可另bubuko.com,布布扣(相对应的,bubuko.com,布布扣),

这样密度表达式(bubuko.com,布布扣)有指数形式:,bubuko.com,布布扣

。相当于bubuko.com,布布扣

 

所以,

 

bubuko.com,布布扣是我们想要的最简形式。

此时,bubuko.com,布布扣,这就是著名的logistic模型。

 

 

 

另外,可以验证定理,

bubuko.com,布布扣,均值

bubuko.com,布布扣,方差

 

注:大部分内容源自zhang san guo老师课件。

 

logistic公式形式的由来,从广义线性回归说起

标签:style   http   ar   sp   for   问题   log   bs   ef   

原文地址:http://www.cnblogs.com/zxfengye/p/4156567.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!