码迷,mamicode.com
首页 >  
搜索关键字:knn    ( 730个结果
KNN算法Hadoop实现及kaggle digit recognition数据测试
软件版本:Hadoop2.6,MyEclipse10.0 , Maven 3.3.2源码下载地址:https://github.com/fansy1990/knn 。1. KNN算法思路:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。KNN算法中,所选择的邻居都是已经正确分类的对象。该方法在定类决策上只依据最邻近的一个或者几个样本...
分类:编程语言   时间:2015-07-28 13:07:39    阅读次数:220
k-近邻算法
从今天开始,与大家分享我学习《Machine Learning In Action》这本书的笔记与心得。我会将源码加以详细的注释,这是我自己学习的一个过程,也是想通过这种方式帮助需要学习的童鞋的一种方式。k-近邻算法定义k-近邻(k-Nearest Neighbour,kNN)算法采用测量不同特征值之间的距离的方法进行分类。该方法的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的...
分类:编程语言   时间:2015-07-25 18:26:35    阅读次数:288
KNN算法
knn算法是最近邻算法。直观的理解上,非常容易。为啥?就是在一批已知标签的训练集上,把一个测试集扔进去,根据与训练集的距离大小排列。距离最小的k个挑选出来,查看他们的标签类别。最多那个类别被视为该测试集的类。 怎么理解?假如要判断你喜欢什么运动。我先从和你走得最近的10个朋友入手。假如这10...
分类:编程语言   时间:2015-07-23 23:30:52    阅读次数:176
机器学习随笔01 - k近邻算法
算法名称: k近邻算法 (kNN:k-NearestNeighbor)问题提出: 根据已有对象的归类数据,给新对象(事物)归类。核心思想:将对象分解为特征,因为对象的特征决定了事对象的分类。度量每个特征的程度,将其数字化。所有特征值构成元组,作为该对象的坐标。计算待检测对象和所有已知对象的距离,选择...
分类:编程语言   时间:2015-07-21 12:26:30    阅读次数:107
数据挖掘分类算法--KNN
实验中使用的数据依然是UCI上的Iris,实验中分别有样本数据和测试使用的数据,分别如下:样本数据是分别算则iris中三类数据各30个:5.1,3.5,1.4,0.2,Iris-setosa4.9,3.0,1.4,0.2,Iris-setosa4.7,3.2,1.3,0.2,Iris-setosa4...
分类:编程语言   时间:2015-07-16 15:52:24    阅读次数:157
推荐系统之协同过滤
这个转自csdn,很贴近工程。协同过滤(Collective Filtering)可以说是推荐系统的标配算法。在谈推荐必谈协同的今天,我们也来谈一谈基于KNN的协同过滤在实际的推荐应用中的一些心得体会。我们首先从协同过滤的两个假设聊起。两个假设:用户一般会喜欢与自己喜欢物品相似的物品用户一般会喜欢与...
分类:其他好文   时间:2015-07-13 00:35:56    阅读次数:172
利用Multi-Probe LSH构建ANN高维索引
感谢大神们的无私奉献精神........因此笔者要坚持开源,专注开源,开源就像在HPU的考试中不像其他人作弊一样,长远来看,会有巨大收获。一.背景介绍1.1 相似性搜索简介 高维相似性搜索在音频、图形和传感器数据等特征丰富的数据的基于内容的检索中日益重要,一般来说应用在KNN和ANN。一个针对...
分类:其他好文   时间:2015-07-07 19:02:56    阅读次数:188
KNN分类器
KNN学习(K-Nearest Neighbor algorithm,K最邻近方法 )是一种统计分类器,对数据的特征变量的筛选尤其有效。基本原理KNN的基本思想是:输入没有标签(标注数据的类别),即没有经过分类的新数据,首先提取新数据的特征并与测试集中的每一个数据特征进行比较;然后从测试集中提取K个最邻近(最相似)的数据特征标签,统计这K个最邻近数据中出现次数最多的分类,将其作为新的数据类别。 K...
分类:其他好文   时间:2015-07-07 13:07:06    阅读次数:1684
基于KNN的相关内容推荐
如果做网站的内容运营,相关内容推荐可以帮助用户更快地寻找和发现感兴趣的信息,从而提升网站内容浏览的流畅性,进而提升网站的价值转化。相关内容 推荐最常见的两块就是“关联推荐”和“相关内容推荐”,关联推荐就是我们常说的购物篮分析,即使用购买了某商品的用户同时购买了什么这个规则来发现商品间 的潜在联系,之...
分类:其他好文   时间:2015-07-03 18:46:46    阅读次数:190
KNN算法的补充
文本自动分类技术是文字管理的基础。通过快速、准确的文本自动分类,可以节省大量的人力财力;提高工作效率;让用户快速获得所需资源,改善用户体验。本文着重对KNN文本分类算法进行介绍并提出改进方法。一、相关理论介绍文本分类技术的研究由来已久,并且取得了很多可喜的成果,形成了一套完整的文本自动分类流程。(1...
分类:编程语言   时间:2015-07-03 18:46:25    阅读次数:229
730条   上一页 1 ... 60 61 62 63 64 ... 73 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!