标签:
DBSCAN算法
介绍
DBSCAN是一个基于密度的聚类算法,该算法包括几个重要的概念:核心对象,直接密度可达,密度可达,密度相连,这几个概念是层层递进的关系。
概念
核心对象:在ε范围内邻居点大于等于Minpt的对象,其中ε和Minpt为用户定义的参数。
直接密度可达:设p为核心对象,|q,p| <= ε,则从p到q关于ε和Minpt直接密度可达。
密度可达:设p1,p2,p3....pn为一个对象序列,从pi+1到pi直接密度可达,则pn到p1密度可达。
密度相连:从o到p和q密度可达,则p和q之间密度相连。
聚类过程
遍历数据集,从某一个核心对象p开始,寻找该核心对象的所有密度相连点,将所有密度相连点加入到p所在的簇中。寻找p的直接密度可达点中的核心对象,将这些核心对象的密度相连点也都加到p中,如此递归操作,直到不能再扩充。
标签:
原文地址:http://www.cnblogs.com/shidagsf/p/4729373.html