码迷,mamicode.com
首页 >  
搜索关键字:聚类    ( 1791个结果
聚类分析-R语言
1、随机生成三个簇点: > c1 c2 c3 v=rbind(c1,c2,c3) 查看分布情况 > plot(v) 图 1 产生的随机数据 2、K聚类 像PAM这样的K-中心点算法(常见的K-means,K-medois等等)在小型数据集上运行良好,但是不能很好的用于大数据集运行。为了处理大数据集,...
分类:编程语言   时间:2015-08-03 13:02:42    阅读次数:1335
聚类--汇总
聚类--简介 主要包括如下几方面的内容:常见聚类方法简介;聚类的方法有如下几种:基于层次的聚类;基于网格的聚类;基于密度的聚类;基于图论的聚类;基于距离的聚类;灰色聚类;模糊等价关系聚类;基于关键词搜索的网页聚类1、层次聚类算法1.1聚合聚类1.1.1相似度依据距离不同:Single-Link:最近...
分类:其他好文   时间:2015-08-02 10:10:24    阅读次数:216
中国餐馆过程(CRP)
查如何事先确定聚类簇数目发现的,是对狄利克雷过程的(DP)的一种解释。 假设一个中国餐馆有无限的桌子,第一个顾客到来之后坐在第一张桌子上。第二个顾客来到可以选择坐在第一张桌子上,也可以选择坐在一张新的桌子上,假设第n+1个顾客到来的时候,已经有k张桌子上有顾客了,分别坐了n1,n2,...,n...
分类:其他好文   时间:2015-08-01 21:47:07    阅读次数:203
R聚类分析
数据格式:时间(小时)/各个省份数据数据输入:locdata <- read.csv("./data.csv")此时locdata的类型为:data.frame需要转化为matric类型:locdata_m <- as.matrix(locdata)剔除数据:locdata_mt <- locdat...
分类:其他好文   时间:2015-07-31 14:22:34    阅读次数:131
K-means clustering (K-means聚类)
问题:K-所有值聚类是无监督学习算法设数据集。当中,。如果这个数据能够分为类。把这个问题模型化:,当中代表第类的聚点(中心点、均值)。该模型能够用EM算法进行训练:初始化,。E步:固定。最小化,显然。当中。M步:固定。最小化,,。直至收敛。——————————————————————————————...
分类:其他好文   时间:2015-07-30 16:53:25    阅读次数:134
SOM自组织映射
SOM, 即Self- Organizing Mapping( 自组织映射网络) , 或称为Self- Organizing Feature Mapping( 自组织特征映射网络) , 它是一种无指导训练的神经网络, 自组织的过程实际上就是一种无指导的学习。它通过自身训练, 自动对输入模式进行聚类。它的拓扑结构图。最早是由芬兰赫尔辛基理工大学Kohen于1981年提出的。它模拟人脑中处于不同区域的神...
分类:其他好文   时间:2015-07-29 23:10:30    阅读次数:346
增强学习(Reinforcement Learning and Control)
增强学习(Reinforcement Learning and Control)[pdf版本]增强学习.pdf 在之前的讨论中,我们总是给定一个样本x,然后给或者不给label y。之后对样本进行拟合、分类、聚类或者降维等操作。然而对于很多序列决策或者控制问题,很难有这么规则的样本。比如,四足机器人...
分类:其他好文   时间:2015-07-29 15:36:56    阅读次数:173
《机器学习实战》之K-均值聚类算法的python实现
《机器学习实战》之K-均值聚类算法的python实现最近的项目是关于“基于数据挖掘的电路故障分析”,项目基本上都是师兄们在做,我只是在研究关于项目中用到的如下几种算法:二分均值聚类、最近邻分类、基于规则的分类器以及支持向量机。基于项目的保密性(其实也没有什么保密的,但是怕以后老板看到我写的这篇博文,所以,你懂的),这里就不介绍“基于数据挖掘的电路故障分析”的思路了。废话不多说了,开始正题哈。...
分类:编程语言   时间:2015-07-28 23:20:37    阅读次数:646
《机器学习实战》之二分K-均值聚类算法的python实现
《机器学习实战》之二分K-均值聚类算法的python实现上面博文介绍了K-均值聚类算法及其用python实现,上篇博文中的两张截图,我们可以看到,由于K-均值聚类算法中由于初始质心的选取,会造成聚类的局部最优,并不是全局最优,因此,会造成聚类的效果并不理想,为克服K-均值算法收敛于局部最小值的问题,就有了二分K-均值算法。二分K-均值聚类算法二分K均值算法是基本K均值算法的直接扩充,其基本思想是:为...
分类:编程语言   时间:2015-07-28 23:16:26    阅读次数:328
Python 层次聚类中发现的一处 Bug
闲话少说先上代码 # 读方式打开文件 myfile=h5py.File('arr.mat','r') arr = myfile['arr'][:] myfile.close() slt = 'ward' while clust_model = sklearn.cluster.AgglomerativeClustering(linkage=slt, affinity="euclidean", n...
分类:编程语言   时间:2015-07-28 18:33:11    阅读次数:418
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!