码迷,mamicode.com
首页 > 编程语言 > 详细

【黎明传数==>机器学习速成宝典】模型篇04——k近邻法【kNN】(附python代码)

时间:2017-11-26 17:52:22      阅读:166      评论:0      收藏:0      [点我收藏+]

标签:com   knn   image   eal   cal   src   坐标系   nbsp   int   

目录

  什么是k近邻算法

  模型的三个基本要素

  构造kd树

  搜索kd树

  Python代码(sklearn库)


 

什么K近邻算法(k-Nearest Neighbor,kNN) 

  引例

  假设有数据集,其中前6部是训练集(有属性值和标记),我们根据训练集训练一个KNN模型,预测最后一部影片的电影类型。

 技术分享图片

 

  首先,将训练集中的所有样例画入坐标系,也将待测样例画入

技术分享图片

 

  然后计算待测分类的电影与所有已知分类的电影的欧式距离

技术分享图片

 

  接着,将这些电影按照距离升序排序,取前k个电影,假设k=3,那么我们得到的电影依次是《He‘s Not Really Into Dudes》、《Beautiful Woman》和《California Man》。而这三部电影全是爱情片,因此我们判定未知电影是爱情片。

 

【黎明传数==>机器学习速成宝典】模型篇04——k近邻法【kNN】(附python代码)

标签:com   knn   image   eal   cal   src   坐标系   nbsp   int   

原文地址:http://www.cnblogs.com/itmorn/p/7899342.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!