机器学习笔记—Logistic回归

时间：2016-09-25 22:07:14 阅读：178 评论：0 收藏：0 [点我收藏+]

标签：

本文申明：本系列笔记全部为原创内容，如有转载请申明原地址出处。谢谢

序言：what is logistic regression? Logistics 一词表示adj.逻辑的;[军]后勤学的n.[逻]数理逻辑;符号逻辑;[军]后勤学， “回归”是由英国著名生物学家兼统计学家高尔顿在研究人类遗传问题时提出来的。为了研究父代与子代身高的关系，高尔顿搜集了1078对父亲及其儿子的身高数据。他发现这些数据的散点图大致呈直线状态，也就是说，总的趋势是父亲的身高增加时，儿子的身高也倾向于增加。但是，高尔顿对试验数据进行了深入的分析，发现了一个很有趣的现象—回归效应。因为当父亲高于平均身高时，他们的儿子身高比他更高的概率要小于比他更矮的概率；父亲矮于平均身高时，他们的儿子身高比他更矮的概率要小于比他更高的概率。它反映了一个规律，即这两种身高父亲的儿子的身高，有向他们父辈的平均身高回归的趋势。对于这个一般结论的解释是:大自然具有一种约束力，使人类身高的分布相对稳定而不产生两极分化，这就是所谓的回归效应。这种方法就被称为回归。

那么logistic回归是不是就是用逻辑进行回归分析，然后做出分类？且听下文慢慢道来。

为了简化分析，我们首先把它定义为一个二分问题，例如：

if x>0.5

print 1

else

print 0

对于现实问题，0.5这个地方一定是一个大的跳跃，那我们该如何定义这个函数呢。

那我们就得从我们伟大的前辈那取经了，我们找到一个叫做Sigmoid的东西，这个函数图像如下：

大家看这个函数6不6.

现在我们为了实现logistic回归分类器，我们把数据的特征都乘以一个回归系数（这个回归系数是通过数据学习到的），把这些值加起来，带进我们的sigmoid函数：

，进而得到一个范围在0~1之间的数值，任何大于0.5的数据被分入1类，小于0.5的都被分到0类。所以，logistic回归也可是说是一种概率估计。

既然模型已经建立了，那我们接下来要干嘛呢？那是不是变成了确定那个回归系数，那么我们的分类模型是不是就建立了，但是这个最佳模型系数（回归系数）怎么确定呢？

下面我给出是两种方法，大家看看哪种方法比较好：

方法一：梯度上升算法

梯度上升算法的思想是：函数J(A)在某点A_K的梯度G[J(A_K)]是一个向量，它的方向与过点A_K 的等量面J(A_K)=C的法线方向重合，指向J(A_K)增加的一方，是这个函数变化率最大的方向。相反，负方向就是减少的最快方向，所以求这个函数的最大值或者最小值时，分别沿着正梯度和负梯度方向搜索有可能最快地找到最小值。

梯度算法实现：以梯度上升算法为例，先任意选择一个初始的权向量A₁(一般为0)然后计算A₁上的梯度G[J(A₁)]，从A₁出发在最陡的方向上移动一个距离d（自己设置）到达A₂.那么可以采用下面公式从A_K推到A_K+1.

A_K+1=A_K-d G[J(A_K)]

我们来补充一下什么叫准则函数 （criterion function）：

用具体函数评价系统所采取策略优劣的准则时,称为准则函数。根据实际问题的类型和...准则函数的取值取决于决策者所采取的策略。如果采取某种策略能使准则函数达到最优值时，称这种策略为这种准则的最优策略。

logistic准则函数的定义是：