一.算法概述 DBSCAN(Density-Based Spatial Clustering of Applications with Noise)是一个比较有代表性的基于密度的聚类算法。与划分和层次聚类方法不同,它将簇定义为密度相连的点的最大集合,能够把具有足够高密度的区域划分为簇,并可在噪声的....
分类:
数据库 时间:
2015-07-05 23:49:55
阅读次数:
442
根据各行业特性,人们提出了多种聚类算法,简单分为:基于层次、划分、密度、图论、网格和模型的几大类。其中,基于密度的聚类算法以DBSCAN最具有代表性。假设有如下图的一组数据, 生成数据的R代码如下x1 <- seq(0,pi,length.out=100)y1 <- sin(x1) + 0.1*rn...
分类:
数据库 时间:
2015-07-04 22:08:57
阅读次数:
384
聚类分析就仅根据在数据中发现的描述对象及其关系的信息,将数据对象分组(簇)。其目标是,组内的对象相互之间是相似的,而不同组中的对象是不同的。组内相似性越大,组间差别越大,聚类就越好。先介绍下聚类的不同类型,通常有以下几种:(1)层次的与划分的:如果允许簇具有子簇,则我们得到一个层次聚类。层次聚类是嵌...
分类:
数据库 时间:
2015-04-05 21:47:37
阅读次数:
219
简单的说就是根据一个根据对象的密度不断扩展的过程的算法。一个对象O的密度可以用靠近O的对象数来判断。学习DBSCAN算法,需要弄清楚几个概念:一:基本概念1.:对象O的是与O为中心,为半径的空间,参数,是用户指定每个对象的领域半径值。2.MinPts(领域密度阀值):对象的的对象数量。3.核心对象:...
分类:
数据库 时间:
2015-03-15 18:16:57
阅读次数:
225
#include
#define dimense 10
//10维数据
#define N 5005
#define MAX 0xffffff
#define clr(a) memset(a,0,sizeof(a))
using namespace std;
double radius=60;
int min_num=400;
int num=5000;//数据量
int k;
int now=0...
分类:
数据库 时间:
2014-12-04 08:49:50
阅读次数:
325
一 什么是基于密度的聚类算法
由于层次聚类算法和划分式聚类算往往只能发现凸形的聚类簇。为了弥补这一缺陷,发现各种任意形状的聚类簇,开发出基于密度的聚类算法。这类算法认为,在整个样本空间点中,各目标类簇是由一群的稠密样本点组成的,而这些稠密样本点被低密度区域(噪声)分割,而算法的目的就是要过滤低密度区域,发现稠密样本点。
二 DBSCAN(Density-based Spatial ...
分类:
数据库 时间:
2014-11-05 13:00:41
阅读次数:
308
Weka算法Clusterers-DBSCAN源码分析...
分类:
数据库 时间:
2014-10-12 23:50:58
阅读次数:
371
改算法可以用于实时路况的gps点的去噪,伪码如下: 输入: E: 对象半径 Minpst: 给定D中E领域以内成为核心点的最小点数 D: 集合 目标:找到多个联通的最大相互密度直接可达的点的集合 repeat: 判断点是否是核心点 ...
分类:
数据库 时间:
2014-09-05 18:35:12
阅读次数:
231
原文地址http://blog.sina.com.cn/s/blog_62186b460101ard2.html这里只是将比较重要的部分转一下另外还有一篇关于层次聚类的http://blog.csdn.net/jwh_bupt/article/details/7685809聚类分析就仅根据在数据中发...
分类:
数据库 时间:
2014-08-08 17:40:26
阅读次数:
425
百度百科中的描述算法描述:(1)检测数据库中尚未检查过的对象p,如果p为被处理(归为某个簇或者标记为噪声),则检查其邻域,若包含的对象数不小于minPts,建立新簇C,将其中的所有点加入候选集N;(2)对候选集N 中所有尚未被处理的对象q,检查其邻域,若至少包含minPts个对象,则将这些对象加入N...
分类:
数据库 时间:
2014-06-30 12:31:47
阅读次数:
344