码迷,mamicode.com
首页 > 编程语言 > 详细

聚类算法——KMEANS算法

时间:2017-11-02 14:27:19      阅读:258      评论:0      收藏:0      [点我收藏+]

标签:简单   优势   欧几里得   标准化   聚类   blog   es2017   个数   流程   

聚类概念

  无监督问题:我们手里没有标签

  聚类:相似的东西分到一组

  难点:如何评估,如何调参

    技术分享

基本概念

  要得到簇的个数,需要指定K值

  质心:均值,即向量各维取平均即可

  距离的度量:常用欧几里得距离和余弦度(先标准化)

  优化目标:

        技术分享

  工作流程:

        技术分享

  优势:

    简单、快速、适合常规数据集

  劣势:

    K值难确定

    复杂度与样本呈线性关系

    很难发现任意形状的簇

      技术分享

 

聚类算法——KMEANS算法

标签:简单   优势   欧几里得   标准化   聚类   blog   es2017   个数   流程   

原文地址:http://www.cnblogs.com/hellojack/p/7771758.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!