平均最近邻可以得出一份数据的具体聚集程度的指数,通过这个指数,可以对比不同数据中,哪个数据的聚集程度最大。适用于对固定研究区域中不同的要素进行比较。比如在同一城市范围内,不同类型的企业之间的分布情况的研究;或者同一类型的企业,在固定区域以内,随着不同年份的变化情况的研究。...
分类:
其他好文 时间:
2015-08-11 16:12:12
阅读次数:
176
一、什么是看KNN算法?
二、KNN算法的一般流程
三、KNN算法的Python代码实现
一:什么是看KNN算法?
kNN算法全称是k-最近邻算法(K-Nearest Neighbor)
kNN算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。该方法在确定分类决策...
分类:
编程语言 时间:
2015-08-11 14:15:43
阅读次数:
897
在关于径向基神经网络的一篇博文机器学习之径向基神经网络(RBF
NN)中已经对最近邻思想进行过描述,但是写到了RBF中有些重点不够突出,所以,这里重新对最近邻和K近邻的基本思想进行介绍,简洁扼要的加以总结。
最近邻的基本思想
保存所有观察到的有标签的样本,然后对新来的测试样本,在标签样本集中找到与测试样本最接近的标签样本,然后将该标签样本作为测试样本的输出。这是一种典型的监督式学习。在...
分类:
编程语言 时间:
2015-08-07 09:36:29
阅读次数:
181
《机器学习实战》之K-均值聚类算法的python实现最近的项目是关于“基于数据挖掘的电路故障分析”,项目基本上都是师兄们在做,我只是在研究关于项目中用到的如下几种算法:二分均值聚类、最近邻分类、基于规则的分类器以及支持向量机。基于项目的保密性(其实也没有什么保密的,但是怕以后老板看到我写的这篇博文,所以,你懂的),这里就不介绍“基于数据挖掘的电路故障分析”的思路了。废话不多说了,开始正题哈。...
分类:
编程语言 时间:
2015-07-28 23:20:37
阅读次数:
646
knn算法是最近邻算法。直观的理解上,非常容易。为啥?就是在一批已知标签的训练集上,把一个测试集扔进去,根据与训练集的距离大小排列。距离最小的k个挑选出来,查看他们的标签类别。最多那个类别被视为该测试集的类。 怎么理解?假如要判断你喜欢什么运动。我先从和你走得最近的10个朋友入手。假如这10...
分类:
编程语言 时间:
2015-07-23 23:30:52
阅读次数:
176
本文基于台大机器学习技法系列课程进行的笔记总结。
主要内容如下图所示:
首先介绍一下径向基函数网络的Hypothesis和网络的结构,然后介绍径向基神经网络学习算法,以及利用K-means进行的学习,最后通过一个实例加深对RBF神经网络认识和理解。
RBF神经网络的Hypothesis和网络结构
我们从基于Gaussian kernel的support vector mac...
分类:
其他好文 时间:
2015-07-17 09:50:54
阅读次数:
249
clear; lena=imread('a1.bmp'); %以下三行指定缩放倍数为0.5,即长宽各变为原始图像的0.5倍, %分别使用三种插值方法,即最近邻插值(默认)、双线性插值、双三次插值 lena0_5_1=imresize(lena,0.5);% lena0_5_2=imresize(le...
分类:
其他好文 时间:
2015-06-23 17:32:33
阅读次数:
209
kd树(k-dimensional树的简称),是一种分割k维数据空间的数据结构。主要应用于多维空间关键数据的搜索(如:范围搜索和最近邻搜索)。
索引结构中相似性查询有两种基本的方式:一种是范围查询(range searches),另一种是K近邻查询(K-neighbor searches)。范围查询就是给定查询点和查询距离的阈值,从数据集中找出所有与查询点距离小于阈值的数据;K近邻查询是给定查...
分类:
其他好文 时间:
2015-06-13 17:11:27
阅读次数:
334
k近邻法(k-nearest neighbor,k-NN) 输入:实例的特征向量,对应于特征空间的点;输出:实例的类别,可以取多类。 分类时,根据其k个最近邻的训练实例的类别,通过多数表决等方式进行预测。 实例类别已定,不具有显式的学习过程。k近邻法实际上利用训练数据集对特征 向量空间进行划分,并作...
分类:
其他好文 时间:
2015-06-11 21:05:23
阅读次数:
227
引文:前面提到的K最近邻算法和决策树算法,数据实例最终被明确的划分到某个分类中,下面介绍一种不能完全确定数据实例应该划分到哪个类别,或者说只能给数据实例属于给定分类的概率。基于贝叶斯决策理论的分类方法之朴素贝叶斯
优点:在数据较少的情况下仍然有效,可以处理多类别问题
缺点:对于输入数据的准备方式较为敏感
适用数据类型:标称型数据。
朴素贝叶斯的一般过程
收集数据:可以使用任何方式
准备数据:需要数...
分类:
编程语言 时间:
2015-05-28 14:09:46
阅读次数:
263