标签:targe line nali net 子集 gmm partition 数据 detail
聚类算法是机器学习的一个重要分支,一般采用无监督学习,常见聚类算法分类有K-Means, K-Medoids, GMM, Spectral clustering,Ncut等。
分类:
1. Partitioning approach:
建立数据的不同分割,然后用相同标准评价聚类结果。(比如最小化平方误差和)目标:找出一个分割,使得距离平方和最小
典型算法:K-Means, K-Medoids
K-Means算法:
1. 将数据分为k个非空子集
2. 计算每个类中心点seed point
3. 将每个object聚类到最近seed point
4. 返回2,当聚类结果不再变化的时候stop
2. Model-based:
对于每个类假定一个分布模型,试图找到每个类最好的模型
典型算法:GMM(混合高斯)
GMM:将k个高斯模型混合在一起,每个点出现的概率是几个高斯混合的结果。EM应用到GMM进行参数的求解。
3. Dimensionality Reduction Approach:
先降维,再聚类
典型算法:Spectral clustering,Ncut
标签:targe line nali net 子集 gmm partition 数据 detail
原文地址:http://www.cnblogs.com/yujing611033/p/6011665.html