码迷,mamicode.com
首页 > 编程语言 > 详细

Kmeans算法

时间:2018-01-30 22:52:33      阅读:199      评论:0      收藏:0      [点我收藏+]

标签:kmeans   算法   分配   color   col   nbsp   其他   中心   blog   

一、Kmeans算法流程:

1.选取K个类中心(首次随机选取)

2.计算每个点到K个类中心的距离

3.把数据点分配距离最近的一个类中心

4.计算新的类中心(对该类中的所有点取均值

5.重复234,直至满足终止条件后终止迭代

  • 不再有重新分配
  • 最大迭代数
  • 所有类中心移动小于某一阈值  

 

二、Kmean算法类数K的选取:多值尝试聚类指标最优提升转折点

 

三、Kmean算法初始类中心选取:

  • 多次全随机取最优
  • 最远选取
  1. 第一个类中心:随机选取
  2. 第二个类中心:距离第一个类中心最远的点
  3. 第三个类中心:距离前两个类中心最远的点
  4. 以此类推,直到第K个
  • 半随机选取(实验证明该方法最有效)
  1. 随机选择第一个类中心
  2. 记D(x)为数据点x距最近类中心的距离
  3. 选取下一个类中心,选取的概率正比于D(x)^2
  4. 以此类推,直到第K个
  • 其他

Kmeans算法

标签:kmeans   算法   分配   color   col   nbsp   其他   中心   blog   

原文地址:https://www.cnblogs.com/tangbaofang/p/8387141.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!