机器学习基础:Kmeans算法及其优化 CONTENT 1. "算法原理" 2. "算法流程" 3. "算法优化" Kmeans++ Elkan Kmeans Mini Batch Kmeans 4. "与KNN的区别" 5. "算法小结" 6. "sklearn代码实践" 1. 算法原理 对于给定 ...
分类:
编程语言 时间:
2020-04-25 12:42:13
阅读次数:
78
1). 扑克牌手动演练k均值聚类过程:>30张牌,3类 2). *自主编写K-means算法 ,以鸢尾花花瓣长度数据做聚类,并用散点图显示。(加分题) from sklearn.datasets import load_iris import numpy as np import matplotli ...
分类:
编程语言 时间:
2020-04-14 17:01:07
阅读次数:
59
记录时间 第五周 所花时间(包括上课) 18h 代码量 一千五百多行 博客量 一篇 了解的知识 kmeans算法,行业联系图 ...
分类:
其他好文 时间:
2020-03-22 23:46:30
阅读次数:
51
Numpy库、Scipy库、matplotlib库、sklearn库的安装教程:https://blog.csdn.net/qq_35687547/article/details/89364425 。。。 ...
分类:
编程语言 时间:
2020-03-19 21:23:02
阅读次数:
64
[TOC] 资料 "Spark机器学习库(MLlib)中文指南" "关于spark机器学习的知乎专栏" "Spark入门实战系列 8.Spark MLlib(上) 机器学习及SparkMLlib简介" "基本Kmeans算法介绍及其实现" [spark MLlib 概念 1:相关系数( PPMCC ...
分类:
其他好文 时间:
2020-01-31 13:59:26
阅读次数:
104
一、 环境: Python 3.7.4 Pycharm Community 2019.3 二、 问题: 对六个样本点[1, 5], [2, 4], [4, 1], [5, 0], [7, 6], [6, 7]进行K-means聚类。 三、 理论推导 此处依照我个人理解所写,错误之处欢迎指出 K-me ...
分类:
编程语言 时间:
2020-01-16 01:18:53
阅读次数:
108
介绍 kmeans算法又名k均值算法。 算法思想:先从样本集中随机选取 ??k 个样本作为簇中心,并计算所有样本与这 ??k 个“簇中心”的距离,对于每一个样本,将其划分到与其距离最近的“簇中心”所在的簇中,对于新的簇计算各个簇的新的“簇中心”。实现kmeans算法的三点: (1)簇个数 ??k 的 ...
分类:
编程语言 时间:
2019-11-14 23:55:32
阅读次数:
186
Kmeans++算法 Kmeans++算法,主要可以解决初始中心的选择问题,不可解决k的个数。 Kmeans++主要思想是选择的初始聚类中心要尽量的远。 做法: 1. 在输入的数据点中随机选一个作为第一个聚类中心。 2. 对于所有数据点,计算它与最近的聚类中心的距离D(x) 3. 重新选择一个数据点 ...
分类:
编程语言 时间:
2019-11-09 21:46:09
阅读次数:
78
一、背景 煤矿地磅产生了一系列数据: 我想从这些数据中,取出最能反映当前车辆重量的数据(有很多数据是车辆上磅过程中产生的数据)。我于是想到了聚类算法KMeans,该算法思想比较简单。 二、算法步骤 1、从样本中随机取出k个值,作为初始中心 2、以k个中心划分这些数据,分为k个组 3、重新计算出每个组 ...
分类:
编程语言 时间:
2019-07-23 12:55:15
阅读次数:
113
tensorflow执行KMeans算法。 代码如下: from __future__ import print_function?# Ignore all GPUs, tf random forest does not benefit from it.import os?import numpy ...
分类:
编程语言 时间:
2019-07-14 09:30:53
阅读次数:
125