码迷,mamicode.com
首页 > 编程语言 > 详细

机器学习入门-K-means算法

时间:2019-01-19 13:20:27      阅读:185      评论:0      收藏:0      [点我收藏+]

标签:种类型   工作流   流程   inf   问题   机器   nbsp   height   k-means   

无监督问题,我们手里没有标签

聚类:相似的东西聚在一起

难点:如何进行调参

 

K-means算法 

          需要制定k值,用来获得到底有几个簇,即几种类型

          质心:均值,即向量各维取平均值

          距离的度量: 欧式距离和余弦相似度

         优化目标: min∑∑dist(ci, xi)   即每种类别的数据到该类别质心距离的之和最小

                               1-k x

      技术分享图片

 

根据上述的工作流程:

                     第一步:随机选择两个初始点,类别的质心点(图二)

                     第二步: 根据所选的质心点,根据欧式距离对数据进行分类(图三)

                     第三步:求得分类后的每个类别的质心(图四)

                     第四步: 根据所选的质心点,根据欧式距离对数据进行分类(图五)

                     第五步:求得分类后的每个类别的质心(图五)

                     ....  一直到分类的数据类别不发生变化为止

优势:简单,快速,适用于常规数据集,分布较为规则的数据集

劣势:

          K值难确定

          复杂度与样本数据呈线性关系

         不太适用于不规则的数据

 

机器学习入门-K-means算法

标签:种类型   工作流   流程   inf   问题   机器   nbsp   height   k-means   

原文地址:https://www.cnblogs.com/my-love-is-python/p/10291349.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!