标签:算法 UI 距离 k-means 更新 中心 改变 计算 k-means算法
给定样本集D={x1,x2,x3,...xm},K-means算法划分所得簇C={c1,c2,c3,...,ck}的最小平方误差,k表示将数据划分为K簇
E=∑i=1 to k∑x->ci||x-ui||2
ui为簇中心,ui=∑x->cix/|ci| 其中|ci|表示该簇中的样本数,直接计算上面的表达式是很困难的,因此,K-means采用贪心策略
算法如下:
1 随机选取k个样本作为簇中心{u1,u2,...,uk}
2 初始化所有的簇均为空
3 计算每个样本与各个簇中心的欧式距离,如果样本xi与簇中心ui的距离最近,那么将该样本划归该簇
4 经过一次迭代后,更新簇中心ui=∑x->cix/|ci|
5 知道聚类结果不再改变
标签:算法 UI 距离 k-means 更新 中心 改变 计算 k-means算法
原文地址:http://www.cnblogs.com/semen/p/6815256.html