https://www.jianshu.com/p/162c9ec713cf 摘要: 让我们走进K-Means算法的“前世今生”以及和它有关的十个有趣的应用案例。 K-means算法具有悠久的历史,并且也是最常用的聚类算法之一。K-means算法实施起来非常简单,因此,它非常适用于机器学习新手爱好者 ...
分类:
编程语言 时间:
2018-08-24 10:55:42
阅读次数:
154
K means算法流程 给定条件: example set: $(x_1, y_1), (x_2, y_2), \dots, (x_N, y_N)$ 初始化: K个簇类的中心点坐标(用C来表示):$$(\ ...
分类:
其他好文 时间:
2018-08-23 14:16:25
阅读次数:
339
聚类是把一个数据集划分成多个子集的过程,每一个子集称作一个簇(Cluster),聚类使得簇内的对象具有很高的相似性,但与其他簇中的对象很不相似,由聚类分析产生的簇的集合称作一个聚类。在相同的数据集上,不同的聚类算法可能产生不同的聚类。 聚类分析用于洞察数据的分布,观察每个簇的特征,进一步分析特定簇的 ...
分类:
其他好文 时间:
2018-08-23 13:07:58
阅读次数:
520
目录 一.k均值简介 二.应用简介 三.算法 四.选择合适的K 五.具体实例 目录 一.k均值简介 二.应用简介 三.算法 四.选择合适的K 五.具体实例 目录 一.k均值简介 二.应用简介 三.算法 四.选择合适的K 五.具体实例 目录 一.k均值简介 二.应用简介 三.算法 四.选择合适的K 五 ...
分类:
其他好文 时间:
2018-08-23 02:24:17
阅读次数:
370
一:机器学习之间的关系 1.人工智能,机器学习,深度学习 下面是一个历史发展,也是一个包含的关系。 2.人工智能 像人一样思考,像人一样行动。、 下面是所包含的部分。 3.机器学习 重要的是机器使用学习,得到下一步运算。 二:机器学习的领域 1.领域 分类,回归,排序,聚类,降维 2.监督学习,非监 ...
分类:
其他好文 时间:
2018-08-23 00:37:18
阅读次数:
238
word2vec的学习 python的几个扩展工具: 1. numpy 2. scipy 3. gensim word2vec的学习 python的几个扩展工具: 1. numpy 2. scipy 3. gensim 如何对新闻的关键词进行聚类?比如说,给你一个关键词“苍井空”,你怎么把“女优”, ...
分类:
其他好文 时间:
2018-08-21 10:55:00
阅读次数:
117
一、K-Means聚类算法 优点: (1)原理简单,实现容易,收敛速度快 (2)球形边界效果较好 缺点: (1)k取值不好把握 (2)非球形边界效果较差 (3)对噪音和异常点较敏感 应用: (1)被大多数搜索引擎用于通过相似性对网页进行聚类,并识别搜索结果的相关率,有助于搜索引擎减少用户的计算时间 ...
分类:
编程语言 时间:
2018-08-21 01:05:00
阅读次数:
248
“探索推荐引擎内部的秘密”系列将带领读者从浅入深的学习探索推荐引擎的机制,实现方法,其中还涉及一些基本的优化方法,例如聚类和分类的应用。同时在理论讲解的基础上,还会结合 Apache Mahout 介绍如何在大规模数据上实现各种推荐策略,进行策略优化,构建高效的推荐引擎的方法。本文作为这个系列的第一 ...
分类:
其他好文 时间:
2018-08-14 18:56:07
阅读次数:
174
主要参考 K-means 聚类算法及 python 代码实现 还有 《机器学习实战》 这本书,当然前面那个链接的也是参考这本书,懂原理,会用就行了。 1、概述 K-means 算法是集简单和经典于一身的基于距离的聚类算法 采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。 该算 ...
分类:
编程语言 时间:
2018-08-10 17:09:20
阅读次数:
191
k近邻算法(knn)是一种基本的分类与回归的算法,k means是一种基本的聚类方法。 k近邻算法(knn) 基本思路:如果一个样本在特征空间的k个最相似(即特征空间最邻近)的样本大多数属于某一类,则该样本也属于这一类。 影响因素: 1. k值的选择。k的值小,则近似误差小,估计误差大;k的值大,则 ...
分类:
编程语言 时间:
2018-08-10 10:47:02
阅读次数:
147