首页 > 其他好文 > 详细

核函数

时间：2018-08-31 21:24:26 阅读：226 评论：0 收藏：0 [点我收藏+]

标签：样本就是复杂向量不可集中特征线性一个

通过支持向量机，我们可以发现

支持向量机能很好的将两个线性可分的样本分开

那么对于不是线性可分的样本，我们就要通过核函数去处理他了

也就是说，核函数的做用就是将线性不可分的样本，通过核函数印射到另外一个空间中

是样本变成线性可分的

那么常用的核函数有两种

一种是线性核函数

也就是直接x‘ = w * x + b

这样子一般是对线性可分的样本做这个核函数

那对于线性不可分的样本，我们一般是做高斯核函数

高斯核函数表示的是与某个点的相似程度

技术分享图片

l就是这个点

也就是说，将点输入一个高斯核函数只会得到一个值

如果我们有n个高斯核，那么我们之前的点就会变成一个n维空间中的点

然后在高维空间中就是线性可分的了

那么对与一个高斯核来说，我们要选择的东西有两个，一个是l，一个是alaph

对于支持向量机来说

我们要选择有多少个高斯核

首先，对于多少个高斯核

如果我们的数据量比数据的维数大很多的话，我们高斯核就应该选择的多一些

因为这种情况允许我们得到一个复杂的比较准确的边界情况

如果数据量较小，数据维数较大，我们通过训练数据如果使用多个高斯核则特别容易产生过拟合

这时候就只能用少量的高斯核了

然后再说l

我们订好了要选n个高斯核

那么我们就从样本集中随机选n个作为高斯核的l

保证分布的平均

这样可以把样本分为一类一类的，相当于做了一个简单的小聚类

然后点离各种聚类的距离通过加权计算(SVM)即可得到正确的解

最后说alaph

如果alaph过大那么在距离l很远的点，这个核函数都会有较大的返回值

这样的话可能误差较大(因为特征不明显)，方差较小

若alaph过小那么只有离l很近的点核函数才会有返回值

这样可能方差较大(特征明显易过拟合)，误差较小

标签：样本就是复杂向量不可集中特征线性一个

原文地址：https://www.cnblogs.com/shensobaolibin/p/9567550.html

踩

(0)

赞

(0)

举报

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

更多

友情链接

兰亭集智国之画百度统计站长统计阿里云 chrome插件新版天听网

关于我们 - 联系我们 - 留言反馈

© 2014 mamicode.com 版权所有联系我们:gaon5@hotmail.com

迷上了代码！