感知器、logistic与svm 区别与联系

时间：2018-06-11 18:59:58 阅读：509 评论：0 收藏：0 [点我收藏+]

https://blog.csdn.net/m0_37786651/article/details/61614865

从感知器谈起

对于典型的二分类问题，线性分类器的目的就是找一个超平面把正负两类分开。对于这个超平面，我们可以用下面的式子来表示，

ω T x + b = 0

感知器是最简单的一种线性分类器。用f(x)表示分类函数，感知器可以如下来表示。

f (x) = s i g n (ω T x + b)

感知器相当于一个阶跃函数，如下图所示，在0处有一个突变。
技术分享图片

损失函数是分类器优化的目标函数，可以用来衡量分类错误的程度，损失函数值越小，代表分类器性能越好。感知器的损失函数为误分类点的函数间隔之和，函数间隔可以理解为样本与分类超平面的距离。误分类点距离分类超平面越远，则损失函数值越大。只有误分类的点会影响损失函数的值。

L = ? y (w T x + b)

从感知器到logistic回归

感知器模型简单直观，但问题在于这个模型不够光滑，比如如果对于一个新的样本点我们计算出ω^T x+b=0.001，只比0大了一点点就会被分为正样本。同时这个点在0处有一个阶跃，导致这一点不连续，在数学上处理起来不方便。
那有没有办法让 $ω^{T} x + b$

Logistic回归的损失函数为logistic损失函数，当分类错误时，函数间隔越大，则损失函数值越大。当分类正确时，样本点距离超平面越远，则损失函数值越小。所有的样本点分布情况都会影响损失函数最后的值。

l o g (1 + e x p (? y (w T x + b)))

从感知器到SVM

在感知器分类选分类超平面时，我们可以选择很多个平面作为超平面，而选择哪个超平面最好呢，我们可以选择距离正样本和负样本最远的超平面作为分类超平面，基于这种想法人们提出了SVM算法。SVM的损失函数为合页函数，当分类错误时，函数间隔越大，则损失函数值越大。当分类正确且样本点距离超平面一定距离以上，则损失函数值为0。误分类的点和与分类超平面距离较近的点会影响损失函数的值。

[1 ? y (w T x + b)] +

感知器、logistic与SVM

三者都是线性分类器，而logistic和svm是由感知器发展改善而来的。区别在于三者的损失函数不同，后两者的损失函数的目的都是增加对分类影响较大的数据点的权重，SVM的处理方法是只考虑support vectors，也就是和分类最相关的少数点，去学习分类器。而逻辑回归通过非线性映射，大大减小了离分类平面较远的点的权重，相对提升了与分类最相关的数据点的权重。下图中红色的曲线代表logistic回归的损失函数，绿色的线代表svm的损失函数。
技术分享图片

参考
[1] 统计学习方法，李航
[2] http://blog.csdn.net/hel_wor/article/details/50539967
[3] https://www.zhihu.com/question/21704547

感知器、logistic与svm 区别与联系

标签：csdn .net nbsp 改善参考数据 https 权重 nts

原文地址：https://www.cnblogs.com/yuluoxingkong/p/9168394.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行