标签:
聚类分析是一种数据归约技术,旨在揭露一个数据集中观测值的子集。它可以把大量的观测值归约为若干个类。 最常用的两种聚类方法是层次聚类(hierarchical agglomerative clustering)和划分聚类(partitioning clustering)。在层次聚类中,每一个观测值自成一类,这些类每次两两合并,直到所有的类被聚成一类为止。在划分聚类中,首先指定类的个数K,然后观测值被随机分成K类,再重新形成聚合的类。
对于层次聚类来说,最常用的算法是单联动(single linkage)、全联动(complete linkage )、平均联动(average linkage) 、质心(centroid)和Ward方法。
对于划分聚类来说,最常用的算法是K均值(K-means)和围绕中心点的划分(PAM)。
最近在看分类和聚类,好一段时间没写博客了,主要是觉得这两个问题都比较复杂,好多东西要整理
标签:
原文地址:http://www.cnblogs.com/aloiswei/p/5966037.html