CLIQUE(Clustering In QUEst)是一种简单的基于网格的聚类方法,用于发现子空间中基于密度的簇。CLIQUE把每个维划分成不重叠的区间,从而把数据对象的整个嵌入空间划分成单元。它使用一个密度阈值识别稠密单元和稀疏单元。一个单元是稠密的,如果映射到它的对象数超过该密度阈值。CLIQ...
分类:
编程语言 时间:
2015-07-25 22:48:40
阅读次数:
263
像上一篇文章 《聚类思想分析》 所述, 聚类算法无所谓好坏,重点在于合理使用各类算法达到最优效果。-----------------------------------------------------------------------------------------------------...
分类:
编程语言 时间:
2015-07-23 19:07:18
阅读次数:
183
聚类算法在数据挖掘中经常使用,思想简单直接。 在系统中,自己也实现过几个聚类算法,做针对性的优化也并无它难度。 由于其方式的简单,开始也未对它有过深入思考。 但是,如果你想让数据自己说话,还是离不开聚类。 因此调研了很多聚类算法,做一些总结。-----------------------...
分类:
其他好文 时间:
2015-07-23 13:30:47
阅读次数:
144
使用 isodata 聚类算法来确定多维属性空间中像元自然分组的特征并将结果存储在输出 ASCII 特征文件中。...
分类:
其他好文 时间:
2015-07-21 12:55:38
阅读次数:
131
数据集如下所示:1,1,12,1.5,13,0.5,13,5,-17,0.75,-17,4,28,5,28,5.5,2数据集有三个属性,分别是二维坐标中的x和y,第三个属性是所属的类,-1代表为孤立点,坐标系如下图所示:源代码如下:package neugle.dbscan;import java....
分类:
数据库 时间:
2015-07-20 18:42:42
阅读次数:
203
算法采用数据集为iris(鸢尾花)可以在UCI上下载 http://archive.ics.uci.edu/ml/datasets/Iris数据集介绍:1. sepal length in cm2. sepal width in cm3. petal length in cm4. petal wid...
分类:
编程语言 时间:
2015-07-14 20:03:17
阅读次数:
132
在分类聚类算法,推荐系统中,常要用到两个输入变量(通常是特征向量的形式)距离的计算,即相似性度量.不同相似性度量对于算法的结果,有些时候,差异很大.因此,有必要根据输入数据的特征,选择一种合适的相似性度量方法。
令X=(x1,x2,..,xn)T,Y=(y1,y2,...yn)T为两个输入向量,
1.欧几里得距离(Euclidean distance)-EuclideanDistance...
分类:
其他好文 时间:
2015-07-12 23:23:09
阅读次数:
957
上一篇博客写了k-means聚类算法和改进的k-means算法,这篇博客就贴出对应的MATLAB和C++代码。以下是MATLAB代码,实现用k-means进行分割: %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
功能:实现如何利用Kmeans聚类实现图像的分割;
时间:2015-07
%%%%%%%%%%%%%%%%%%%%%...
分类:
编程语言 时间:
2015-07-06 14:16:53
阅读次数:
315
一.算法概述 DBSCAN(Density-Based Spatial Clustering of Applications with Noise)是一个比较有代表性的基于密度的聚类算法。与划分和层次聚类方法不同,它将簇定义为密度相连的点的最大集合,能够把具有足够高密度的区域划分为簇,并可在噪声的....
分类:
数据库 时间:
2015-07-05 23:49:55
阅读次数:
442
根据各行业特性,人们提出了多种聚类算法,简单分为:基于层次、划分、密度、图论、网格和模型的几大类。其中,基于密度的聚类算法以DBSCAN最具有代表性。假设有如下图的一组数据, 生成数据的R代码如下x1 <- seq(0,pi,length.out=100)y1 <- sin(x1) + 0.1*rn...
分类:
数据库 时间:
2015-07-04 22:08:57
阅读次数:
384