码迷,mamicode.com
首页 > 编程语言 > 详细

机器学习-K-means聚类及算法实现(基于R语言)

时间:2019-06-08 18:48:07      阅读:308      评论:0      收藏:0      [点我收藏+]

标签:nbsp   补充   业务   数值   意义   info   bsp   方便   code   

K-means聚类

将n个观测点,按一定标准(数据点的相似度),划归到k个聚类(用户划分、产品类别划分等)中。

重要概念:质心

技术图片

技术图片

K-means聚类要求的变量是数值变量,方便计算距离。

 

算法实现

技术图片

 

R语言实现

 k-means算法是将数值转换为距离,然后测量距离远近进行聚类的。不归一化的会使得距离非常远。

补充:scale归一化处理的意义

两个变量之间数值差别太大,比如年龄与收入的数值差别就很大。

技术图片

步骤

技术图片

第一步,确定聚类数量,即k的值

方法:肘部法则+实际业务需求

技术图片

第二步,运行K-means模型

技术图片

第三步,总结聚类模型结果

技术图片

 

机器学习-K-means聚类及算法实现(基于R语言)

标签:nbsp   补充   业务   数值   意义   info   bsp   方便   code   

原文地址:https://www.cnblogs.com/Grayling/p/10991252.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!