码迷,mamicode.com
首页 > 编程语言 > 详细

聚类算法K-means

时间:2015-06-05 14:09:14      阅读:118      评论:0      收藏:0      [点我收藏+]

标签:

顾名思义,这个算法是与K相关的一个方法,事实也是如此。

对于一个大的集群,该方法通过对以下三步的不停迭代得出结果:

  1. 确定K值,K值表示需要将这个大的集群分成多少个小的簇(聚类)。然后虚拟K个中心位于集群坐标系内。

  2. 计算集群坐标系内所有点与K个中心点的位置,将距离中心点最近的点划归一簇。

  3. 根据每一簇的所有点计算这一簇的重心,将其作新的K个中心点重复这一过程。


为何要迭代

经过证明,算法是必然收敛的。意思也就是说,在N次迭代后,K个中心点都趋于稳定,不会发生大的变动。


缺点

不适合在坐标系中呈现形状怪异的集群

不适合有属性参数间距过大的集群


聚类算法K-means

标签:

原文地址:http://my.oschina.net/sitan/blog/425190

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!