机器学习-KNN算法

时间：2018-07-06 23:29:00 阅读：208 评论：0 收藏：0 [点我收藏+]

原理

KNN算法，又叫K近邻算法。就是在训练集中数据和标签已知的情况下，输入测试数据，将测试数据的特征与训练集中对应的特征进行相互比较，找到训练集中与之最为相似的前K个数据，则该测试数据对应的类别就是K个数据中出现次数最多的那个分类，其算法的描述为：

技术分享图片

所以一般k会取一个较小的值，然后用过交叉验证来确定
这里所谓的交叉验证就是将样本划分一部分出来为预测样本，比如95%训练，5%预测，然后k分别取1，2，3，4，5之类的，进行预测，计算最后的分类误差，选择误差最小的k

在找到最近的k个实例之后，可以计算这k个实例的平均值作为预测值。或者还可以给这k个实例添加一个权重再求平均值，这个权重与度量距离成反比（越近权重越大）。

KNN算法的优点：

缺点：

技术分享图片

原文地址：https://www.cnblogs.com/zongfa/p/9275787.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

周排行