码迷,mamicode.com
首页 >  
搜索关键字:聚类算法    ( 542个结果
聚类算法小结
看了些论文,小结一下,分享给大家!聚类算法主要可以分为以下几类:1)基于划分的方法划分方法的主要思想是:给定要构建的划分数目k,在数据库中随机选择k个对象,每个对象代表一个类的平均值或中心,根据剩余的对象到类中心的距离将其划分到最近的类,然后重新计算每个类的中心,不断重复这个过程,直到所有的对象都不...
分类:编程语言   时间:2015-02-27 09:53:34    阅读次数:171
kmeans学习与实践
KMeans算法的基本思想是初始随机给定K个簇中心,按照最邻近原则把待分类样本点分到各个簇。然后按平均法重新计算各个簇的质心,从而确定新的簇心。一直迭代,直到簇心的移动距离小于某个给定的值。K-Means聚类算法主要分为三个步骤:(1)第一步是为待聚类的点寻找聚类中心(2)第二步是计算每个点到聚类中...
分类:其他好文   时间:2015-02-26 22:45:26    阅读次数:250
从决策树学习谈到贝叶斯分类算法、EM、HMM
从决策树学习谈到贝叶斯分类算法、EM、HMM引言 近期在面试中,除了基础 & 算法 & 项目之外,经常被问到或被要求介绍和描写叙述下自己所知道的几种分类或聚类算法(当然,这全然不代表你将来的面试中会遇到此类问题,仅仅是由于我的简历上写了句:熟悉常见的聚类 & 分类算法而已),而我向来恨对...
分类:编程语言   时间:2015-02-20 18:33:53    阅读次数:780
GMM的EM算法实现
在 聚类算法K-Means, K-Medoids, GMM, Spectral clustering,Ncut一文中我们给出了GMM算法的基本模型与似然函数,在EM算法原理中对EM算法的实现与收敛性证明进行了具体说明。本文主要针对怎样用EM算法在混合高斯模型下进行聚类进行代码上的分析说明。1. GM...
分类:编程语言   时间:2015-02-09 21:34:57    阅读次数:231
K-Means 聚类算法
K-Means 是一种基于距离的排他的聚类划分方法。K-Means 基本原理:给定划分数量 k。创建一个初始划分,从数据集中随机地选择 k 个对象,每个对象初始地代表了一个簇中心(Cluster Centroid)。对于其他对象,计算其与各个簇中心的距离,将它们划入距离最近的簇。采用迭代的重定位技术...
分类:编程语言   时间:2015-02-06 23:05:35    阅读次数:540
BIRCH算法---使用聚类特征树的多阶段算法
更多数据挖掘代码:https://github.com/linyiqun/DataMiningAlgorithm 介绍 BIRCH算法本身上属于一种聚类算法,不过他克服了一些K-Means算法的缺点,比如说这个k的确定,因为这个算法事先本身就没有设定有多少个聚类。他是通过CF-Tree,(ClusterFeature-Tree)聚类特征树实现的。BIRCH的一个重要考虑是最小化I/O,通过扫描...
分类:编程语言   时间:2015-02-06 09:40:23    阅读次数:123
newlisp kmeans算法
kmeans是经典的聚类算法,newlisp提供了函数,同样分为train和query两个阶段。kmeans的算法目的是将训练数据划分成k个类,按照一定的算法动态的选择k个中心点。下面是个例子,我添加了中文注释:(set 'data '( (6.57 4.96 11.91 0.9) (2.29 4.18 1.06 0.8) (8.63 2.51 8.11 0.7) (1.85 1.89 0....
分类:编程语言   时间:2015-02-03 19:36:20    阅读次数:184
GMM的EM算法实现
在 聚类算法K-Means, K-Medoids, GMM, Spectral clustering,Ncut一文中我们给出了GMM算法的基本模型与似然函数,在EM算法原理中对EM算法的实现与收敛性证明进行了具体说明。本文主要针对怎样用EM算法在混合高斯模型下进行聚类进行代码上的分析说明。1. GM...
分类:编程语言   时间:2015-02-01 21:47:26    阅读次数:264
K-means矢量量化算法介绍
K-means算法是最为经典的基于划分的聚类方法,是十大经典数据挖掘算法之一。K-means算法的基本思想是:以空间中k个点为中心进行聚类,对最靠近他们的对象归类。通过迭代的方法,逐次更新各聚类中心的值,直至得到最好的聚类结果。matlab中有kmeans聚类算法的函数可以调用,如[ldx,C,su...
分类:编程语言   时间:2015-01-31 21:46:31    阅读次数:290
基于hadoop的社交网络的分析
昨天终于hadoop的项目验收完成了,终于可以松一口气了,总体还是比较满意的。 首先说一下项目流程,用mapreduce对数据进行预处理,然后用mahout中的聚类算法(kmeans)对数据进行处理,最后用peoplerank对数据进行处理。 根据老师交给我们的数据,包括Google+和Twitter的部分社交网络数据。以下是两个数据下载的链接 http://snap.stanford.ed...
分类:其他好文   时间:2015-01-27 18:24:46    阅读次数:237
542条   上一页 1 ... 43 44 45 46 47 ... 55 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!