首页 > 其他好文 > 详细

感知机(Perceptron)

时间：2016-05-08 16:51:49 阅读：785 评论：0 收藏：0 [点我收藏+]

标签：

感知机(Perceptron)是二分类问题的线性分类模型，其输入为实例的特征向量，输出为实例的类别，取+1和-1二值。

感知机于输入空间（特征空间）中将实例划分为正负两类的分离超平面，属于判别模型。感知机于1957年由Rosenblatt提出，是神经网络和支持向量机的基础。

在这里，不用《统计学习方法》书中的变量表示方式，我们用 $技术分享$ 表示数据集，一共 $技术分享$ 个样本， $技术分享$ 个维度，用 $技术分享$ 表示数据集中的第 $技术分享$ 个样本，用 $技术分享$ 表示标记（类别）向量， $技术分享$ 代表第 $技术分享$ 个样本 $技术分享$ 的标记。

我们将要学习的目标函数是：

$技术分享$

称为感知机。其中， $技术分享$ 和 $技术分享$ 为感知机模型参数， $技术分享$ 为权值向量， $技术分享$ 叫作偏置（bias）， $技术分享$ 表示 $技术分享$ 和 $技术分享$ 的内积。 $技术分享$ 是符号函数，即：

$技术分享$

所以，在这里 $技术分享$ ，根据上式可知 $技术分享$ 时为分类的边界（超平面）。

对于数据集 $技术分享$ ，如果能够将数据集的正负样例完全正确地划分到超平面的两侧，即对于所有 $技术分享$ 的实例 $技术分享$ 有 $技术分享$ ，对于所有 $技术分享$ 的实例 $技术分享$ 有 $技术分享$ ，则称这个数据集为线性可分的数据集，否则数据集线性不可分。

假设数据集是线性可分的，感知机的学习目标是求得一个能够将训练集正负样例能够完全分开的超平面。找出这样的超平面，其实就是要确定感知机的模型参数 $技术分享$ 和 $技术分享$ 。所以我们首先要定义损失函数，再将其最小化。

感知机的损失函数是针对误分类的点，最小化误分类的点到超平面的距离，不断进行调整。

对于输入空间的任一一个样例 $技术分享$ ，所要计算的距离就是这个点到 $技术分享$ 的距离。

根据点到直线的距离公式：

技术分享

代入其中，可以得到：

$技术分享$

进一步，进行简化约等，可以得到如下式子：

$技术分享$

其中， $技术分享$ 是 $技术分享$ 的 $技术分享$ 范数。

对于误分类的样例 $技术分享$ 来说， $技术分享$ 成立。所以误分类的点到超平面的距离为：

$技术分享$

假如对于所有的误分类点集合为 $技术分享$ ，那么所有的误分类点到超平面的总距离为：

$技术分享$

不考虑 $技术分享$ ，就得到了感知机的损失函数：

$技术分享$

显然，损失函数 $技术分享$ 是非负的，如果没有误分类的点，损失函数的值为0。并且，误分类点越少，误分类点离超平面越近，损失函数越小。所以对于完全线性可分的数据集，当损失函数 $技术分享$ 为0时，即达到了完全正确分类。

这个损失函数可以用梯度下降法来解，对于 $技术分享$ 和 $技术分享$ 的梯度用偏导可以直接求出来，具体过程不再赘述。

参考资料：

李航《统计学习方法》

感知机(Perceptron)

标签：

原文地址：http://www.cnblogs.com/Rambler1995/p/5470871.html

踩

(0)

赞

(0)

举报

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

更多

友情链接

兰亭集智国之画百度统计站长统计阿里云 chrome插件新版天听网

关于我们 - 联系我们 - 留言反馈

© 2014 mamicode.com 版权所有联系我们:gaon5@hotmail.com

迷上了代码！