码迷,mamicode.com
首页 > 编程语言 > 详细

数据建模()-K-means聚类算法

时间:2020-01-23 11:04:46      阅读:105      评论:0      收藏:0      [点我收藏+]

标签:规范   样本   分配   停止   中心   k-means算法   聚类算法   指标   分类   

K-Means算法是典型基于距离的非层次聚类算法,在最小化误差函数的基础上将数据划分为预定的类数K,采用作为相似性的评价指标,即认为2个对象的距离越近,其相似度越大。

1.算法过程

1)从N个样本数据中随机选取K个对象作为初始的聚类中心

2)分别计算每个样本到各聚类中心的距离,将对象分配到距离最近的聚类中

3)所有对象分配完成后,重新计算K个聚类的中心

4)与前一次计算得到的K个聚类中心比较,如果聚类中心发生变化,转过程2),否则转过程5)当质心不发生变化时,停止并输出聚类结果

对于连续数据,聚类中心取该簇的均值

样本某些属性为分类变量时,均值可能无定义,可采用K-众数方法

对连续属性,要先对各属性值进行零-均值规范,再进行距离计算。K-Means聚类算法中,一般需要肚量样本间的距离、样本与簇间的距离、簇与簇间的距离

数据建模()-K-means聚类算法

标签:规范   样本   分配   停止   中心   k-means算法   聚类算法   指标   分类   

原文地址:https://www.cnblogs.com/Iceredtea/p/12230274.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!