码迷,mamicode.com
首页 > 其他好文 > 详细

k-means聚类

时间:2018-11-26 13:47:04      阅读:191      评论:0      收藏:0      [点我收藏+]

标签:ssi   info   com   转移   bsp   class   src   评估   图片   

算法:

(1) 随机选择k个初始中心点。
(2) 计算每个数据点到中心点的距离,数据点距离哪个中心点最近就划分到哪一类中。
(3) 把中心点转移到得到的cluster内部的数据点的平均位置。
(4) 重复以上步骤,直到每一类中心在每次迭代后变化不大为止。

 

k值确定:拐点图:组内误差平方和,SSE(sum of squared error)

                 SSE= 技术分享图片

#初始点选择

  (1)首先随机选择一个点作为第一个初始类簇中心点。

  (2)选择距离该点最远的那个点作为第二个初始类簇中心点

  (3)再选择距离前两个点的最近距离最大的点作为第三个初始类簇的中心点。

    (4) 以此类推,直至选出K个初始类簇中心点。

 

#结果评估:平均Silhouette值为:当 大于0.5 时,表明聚类合适

                    技术分享图片

                    s ( i ) =( b( i )- a ( i ) )   /   max ( a ( i ) , b ( i ) )

                    a(i);对象i到同一簇内其他对象的距离平均值                                --凝聚度

                    b(i) : 计算对象i到其他簇B(j)内所有对象的距离平均                   --分散度

                             遍历其他簇B,计算出最近距离

 

k-means聚类

标签:ssi   info   com   转移   bsp   class   src   评估   图片   

原文地址:https://www.cnblogs.com/hapyygril/p/10019373.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!