from sklearn.datasets import load_sample_imagefrom sklearn.cluster import KMeansimport matplotlib.pyplot as pltimport numpy as npchina = load_sample_i ...
分类:
编程语言 时间:
2018-11-07 22:09:05
阅读次数:
319
K-Means算法是无监督的聚类算法,它实现起来比较简单,聚类效果也不错,因此应用很广泛。K-Means算法有大量的变体,本文就从最传统的K-Means算法讲起,在其基础上讲述K-Means的优化变体方法。包括初始化优化K-Means++, 距离计算优化elkan K-Means算法和大数据情况下的 ...
分类:
编程语言 时间:
2018-11-05 10:09:47
阅读次数:
296
K-means算法 在聚类问题中,给定数据集{x(1), . . . , x(m)},想要把这些数据划分成几个紧密联系的簇(clusters)。通常情况下,这里的x(i)∈ Rn,而标签y(i)是未知的。因此这是一个非监督式学习(unsupervised learning)问题。 最简单的聚类算法是 ...
分类:
编程语言 时间:
2018-11-04 19:43:29
阅读次数:
254
第7章 小世界网络模型:本章将围绕小世界网路模型展开,主要内容分为两个部分:(1)如何构建具有较大的聚类特性又具有较短的平均距离的小世界网络模型?(2)什么样的小世界网络才能实现有效搜索? 7.2小世界网络模型 7.2.1小世界网络模型完全规则最近耦合网络:高聚类:c=3(k-2)/4(k-1)>= ...
分类:
其他好文 时间:
2018-11-04 15:39:53
阅读次数:
2999
背景:酵母会在一定的时期发生diauxic shift,有一些基因的表达上升,有一些基因表达被抑制,通过聚类算法,将基因表达的变化模式聚成6类。 ORF Name R1.Ratio R2.Ratio R3.Ratio R4.Ratio R5.Ratio R6.Ratio R7.Ratio 1 YDR ...
分类:
其他好文 时间:
2018-11-04 14:08:32
阅读次数:
196
from sklearn.datasets import load_sample_image from matplotlib import pyplot as plt from sklearn.cluster import KMeans import numpy as np #读取一张示例图片或自己... ...
分类:
编程语言 时间:
2018-11-04 01:47:55
阅读次数:
185
本次实战项目是关于航空公司客户价值的分析,其中用到的聚类方法是K-Means方法,属于非监督学习。 Tools :python 3.6; jupyter os : mac os reference: 数据分析与挖掘实战,csdn 数据分析或挖掘涉及的一般步骤: 数据集中共有62988个客户的基本信息 ...
分类:
其他好文 时间:
2018-11-03 18:17:21
阅读次数:
485
spark JAVA 开发环境搭建及远程调试 以后要在项目中使用Spark 用户昵称文本做一下聚类分析,找出一些违规的昵称信息。以前折腾过Hadoop,于是看了下Spark官网的文档以及 github 上 官方提供的examples,看完了之后决定动手跑一个文本聚类的demo,于是有了下文。 1. ...
分类:
编程语言 时间:
2018-11-03 02:08:21
阅读次数:
1124
#查看图片大小 import sys print(sys.getsizeof(china)) #原图片 print(sys.getsizeof(new_image)) #新图片 819968 128 #原始图片与新图片保存成文件,观察文件的大小。 #理解贝叶斯定理: #M桶:7红3黄 #N桶:1红9 ...
分类:
其他好文 时间:
2018-11-02 14:34:56
阅读次数:
117
1.K-means是一个反复迭代的过程,算法分为四个步骤: (1)选取数据空间中的K个对象作为初始中心,每个对象代表一个聚类中心; (2)对于样本中的数据对象,根据它们与这些聚类中心的欧氏距离,按距离最近的准则将它们分到距离它们最近的聚类中心(最相似)所对应的类; (3)更新聚类中心:将每个类别中所 ...
分类:
编程语言 时间:
2018-10-31 20:07:47
阅读次数:
254