1.概述
1.1 原理:(测量不同的特征值之间的距离进行分类)
存在样本数据集合,即训练样本集,并且样本集中的每个数据都存在多个特征和标签,即我们知道样本数据和其所属分类,在我们输入没有标签的新数据后,将新数据的每个特征和样本集中的数据对应的特征进行比较,然后根据相应算法(本节选择的是欧氏距离)提取与样本集中特征最相近数据得分类标签。一般选择与样本集中最相近的前k个数据,即k-近邻。最后,选择k个最相似数据中出现次数最多的分类最为新数据的分类。
1.2 KNN算法
利用一组测试数据:
标签:算法 gpo 利用 存在 根据 欧氏距离 特征 并且 pos
存在样本数据集合,即训练样本集,并且样本集中的每个数据都存在多个特征和标签,即我们知道样本数据和其所属分类,在我们输入没有标签的新数据后,将新数据的每个特征和样本集中的数据对应的特征进行比较,然后根据相应算法(本节选择的是欧氏距离)提取与样本集中特征最相近数据得分类标签。一般选择与样本集中最相近的前k个数据,即k-近邻。最后,选择k个最相似数据中出现次数最多的分类最为新数据的分类。
利用一组测试数据:
标签:算法 gpo 利用 存在 根据 欧氏距离 特征 并且 pos
原文地址:http://www.cnblogs.com/xiaxiaoai/p/8082441.html