机器学习之逻辑回归

时间：2017-11-07 17:54:39 阅读：158 评论：0 收藏：0 [点我收藏+]

给定一张图片，如何让计算机帮助我们识别它是不是一张猫的图片，这个问题可以看成一个简单的分类问题。如下图所示，平面上有两种不同颜色（黑色，红色）的点，我们要做到就是要找到类似与那条直线那样的界限。当某个点位于直线上方时，那么就可以判定该点是黑色的，当某个点位于直线的下方时，那么就可以判定该点是红色的。

技术分享

正向传播

正向传播考虑的是如何得到这条直线的方程，可以先来假定这条直线的函数为，这里的W和b先任意取一个数（可能会很不准确），当我们把x带入里面后会有一个输出y，从图中我们发现当y值越大，那么它就越可能属于黑色点一类，当y值越小，那么它就越有可能属于红色点一类。这种接近程度通常可以用概率来表示，由此引入sigmoid函数:

技术分享

正如图像所示，sigmoid函数的值域为（0，1），定义域为（-∞，+∞）。下面求两个极限

技术分享

这就意味着无论我们在实数的定义域内取何值，经过sigmoid函数运算后结果都可以收敛于（0，1）之间，而一件事发生的概率取值正好满足此区间。

对于sigmoid函数的理解

令技术分享，，当我们输入x后用事先任取的w，b参与运算后会得到一个z值，这个z值越大，就认为这点越接近黑色的点，将z带入sigmoid函数z值越大g(z)的值就越接近1，可以认为该点是黑色的点的概率越接近1。Z值越小，认为这点越接近红色的点（越远离黑色的点）,将z带入sigmoid函数z值越小g(z)的值就越接近0，可以认为该点是黑色的点的概率越接近0。