标签:选择 最小 维度 算法 排序 是什么 距离 返回 中标
kNN功能:解决输入是数值型或者标称型的分类问题
kNN大致原理:输入数据集相当于在一定维度的空间中标点,测试集(或者说要预测标签的),相当于是计算与这些已有点的距离(一般是欧式距离),选择前k个距离最近的,看这k个已标点的标签是什么(也就是属于哪一类),返回k个中占比最大的标签作为预测结果。ps:k一般取20
算法大体步骤:
1)计算已知类别数据集(训练集)中的点与当前点之间的距离
2)按照距离递增次序排序
3)选取与当前点距离最小的k个点
4)确定前k个点所在类别出现的频率
5)返回前k个点出现频率最高的类别作为当前点的预测分类
标签:选择 最小 维度 算法 排序 是什么 距离 返回 中标
原文地址:https://www.cnblogs.com/maxiaonong/p/9983713.html