码迷,mamicode.com
首页 > 数据库 > 详细

DBScan聚类算法

时间:2014-09-05 18:35:12      阅读:231      评论:0      收藏:0      [点我收藏+]

标签:style   blog   http   ar   数据   sp   log   html   on   

改算法可以用于实时路况的gps点的去噪,伪码如下:

输入:

E: 对象半径

Minpst: 给定D中E领域以内成为核心点的最小点数

D: 集合

目标:找到多个联通的最大相互密度直接可达的点的集合

repeat:

  1. 判断点是否是核心点

  2. 记录该点的直接密度可达点

util 所有输入点完成遍历

repeat:

  1. 将该点的相互直接密度可达的点加入同一组

util 所有核心对象的领域都完成遍历

该算法的好处是:

  1. 能用于去噪

  2. 发现任意形状的聚类

  3. 不需要事先知道聚类的个数

缺陷:

  1. 需要预先定义 对象半径和最小距离


如何找到这样的E呢?一种做法是遍历输入点根据Minpts找到最大的E值,再根据每个点的E值,找到一个变化最快的点(求导)。用改点的E作为最终的E。

参考:

  1. http://baike.baidu.com/view/3063170.htm#5

  2. http://xccds1977.blogspot.com/2012/06/r.html

  3. http://en.wikipedia.org/wiki/DBSCAN#Algorithm

  4. http://en.wikipedia.org/wiki/OPTICS_algorithm

  5. http://en.wikipedia.org/wiki/Hierarchical_clustering

  6. CN200910237940-异常车速数据的识别方法和装置





DBScan聚类算法

标签:style   blog   http   ar   数据   sp   log   html   on   

原文地址:http://my.oschina.net/edwardpku/blog/310632

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!