标签:逻辑回归 最优化问题 特征 数值 变化 png 理想 优化 问题
(注:本文内容和图片来源于林轩田老师的《机器学习基石》课程)
通常的二分类问题,希望输出类别;soft的二分类问题,希望输出概率值:
对于soft问题的理想数据和实际数据:
逻辑回归的思想:先求出特征的线性加权分数,再把它用逻辑斯蒂函数转化为0~1之间的值:
逻辑斯蒂函数介绍:
最大似然:将训练集产生的概率最大化:
运用逻辑斯蒂函数的性质:
可以得到:
因此问题就变为,选择合适的逻辑回归模型h,使得似然函数最大化:
把逻辑回归模型代进去,具体来说,就是:
两边取对数:
最后得到最终形式:
现在的问题是:
用迭代来求最优化问题,如下(其中v是一个单位向量):
梯度下降的思想是:每次更新完以后,函数值尽可能下降到最低。因此相当于:
将式子泰勒展开:
则最小化问题变为:
前面一项是已知的,为了将最后一项向量内积最小化,v应该等于:
(即与梯度相反,再单位化)
η的选择:
因此η应该随梯度动态变化,假设η正比于梯度的大小:
因此,我们就能得到最后的形式。
标签:逻辑回归 最优化问题 特征 数值 变化 png 理想 优化 问题
原文地址:http://www.cnblogs.com/coldyan/p/6137097.html