标签:模型 数据集 分数 完全 实例 定义 是的 集合 sign
感知机是二分类的线性分类模型,属于判别模型。
感知机的模型
定义(感知机) 假设输入空间(特征空间)是,输出空间是。输入表示实例的特征向量,对应于输入空间的点;输出表示实例的类别。由输入空间到输出空间的如下函数:
称为感知机。其中和为感知机模型参数,叫作权值或权值向量,叫作偏置,表示和的内积。sign是符号函数,即
感知机模型的假设空间是定义在特征空间中的所有线性分类模型或线性分类器,即函数集合。
感知机学习策略
数据集的线性可分性
定义(数据集的线性可分性) 给定一个数据集
其中,,如果存在某个超平面S
能够将数据集的正实例点和负实例点完全正确地划分到超平面的两侧,即对所有的实例,有,对所有的实例i,有,则称数据集T为线性可分数据集;否则,称数据集T线性不可分。
感知机学习策略
损失函数的选择是误分类点到超平面S的总距离,这是感知机所采用的。为此,首先写出输入空间中任一点到超平面S的距离:
这里,是的范数。
其次,对于误分类的数据来说,
成立。因为当时,;而当时,。因此,误分类点到超平面S的距离是
PS:因为距离应该为正值,而误分类点的乘积小于0,所以要加负号。
这样,假设超平面S的误分类点集合为M,那么所有误分类点到超平面S的总距离为
不考虑,就得到感知机的损失函数。
?
?
?
?
?
?
?
标签:模型 数据集 分数 完全 实例 定义 是的 集合 sign
原文地址:https://www.cnblogs.com/loveEunha/p/11551642.html