在 聚类算法K-Means, K-Medoids, GMM, Spectral clustering,Ncut一文中我们给出了GMM算法的基本模型与似然函数,在EM算法原理中对EM算法的实现与收敛性证明进行了具体说明。本文主要针对怎样用EM算法在混合高斯模型下进行聚类进行代码上的分析说明。1. GM...
分类:
其他好文 时间:
2014-07-18 19:25:06
阅读次数:
204
一 算法描述1、随机选取k个对象作为初始簇中心;2、计算每个对象到簇中心的距离,将每个对象聚类到离该对象最近的聚簇中去;3、计算每个聚簇中的簇均值,并将簇均值作为新的簇中心;4、计算准则函数;5、重复(2)、(3)和(4),直到准则函数不再发生变化。二源码分析
分类:
其他好文 时间:
2014-07-16 21:20:48
阅读次数:
202
K-means是一种聚类算法,其要求用户设定聚类个数k作为输入參数,因此,在执行此算法前,须要预计须要的簇的个数。如果有n个点,须要聚到k个簇中。K-means算法首先从包括k个中心点的初始集合開始,即随机初始化簇的中心。随后,算法进行多次迭代处理并调整中心位置,知道达到最大迭代次数或中性收敛于固定...
分类:
其他好文 时间:
2014-07-16 20:04:42
阅读次数:
184
(一)深入浅出理解索引结构 实际上,您可以把索引理解为一种特殊的目录。微软的SQL SERVER提供了两种索引:聚集索引(clustered index,也称聚类索引、簇集索引)和非聚集索引(nonclustered index,也称非聚类索引、非簇集索引)。下面,我们举例来说明一下聚集索引和非聚集...
分类:
数据库 时间:
2014-07-16 18:34:29
阅读次数:
307
在聚类中我们经经常使用到EM算法(i.e. Estimation - Maximization)进行參数预计, 在该算法中我们通过函数的凹/凸性,在estimation和maximization两步中迭代地进行參数预计,并保证能够算法收敛,达到局部最优解。PS:为了不在11.11这个吉祥的日子发bl...
分类:
其他好文 时间:
2014-07-16 18:09:11
阅读次数:
218
在 聚类算法K-Means, K-Medoids, GMM, Spectral clustering,Ncut一文中我们给出了GMM算法的基本模型与似然函数,在EM算法原理中对EM算法的实现与收敛性证明进行了具体说明。本文主要针对怎样用EM算法在混合高斯模型下进行聚类进行代码上的分析说明。1. GM...
分类:
其他好文 时间:
2014-07-15 09:13:23
阅读次数:
355
聚类:就是将一个对象的集合分成几个簇,每个簇之间的对象不相似,但是簇内对象相似。可以认为是“物以类聚”。从这个简单的描述中,可以看出聚类的关键是如何度量对象间的相似性。较为常见的用于度量对象的相似度的方法有距离、密度等。k-Means:k-Means算法的核心思想是把n个数据对象划分为k个类(这k各...
分类:
其他好文 时间:
2014-07-14 21:27:26
阅读次数:
309
在聚类中我们经经常使用到EM算法(i.e. Estimation - Maximization)进行參数预计, 在该算法中我们通过函数的凹/凸性,在estimation和maximization两步中迭代地进行參数预计,并保证能够算法收敛,达到局部最优解。PS:为了不在11.11这个吉祥的日子发bl...
分类:
其他好文 时间:
2014-07-14 15:28:42
阅读次数:
164
///利用opencv提供的函数cvKMeans2()实现图像聚类
///////运行环境:VC6.0+opencv1.0
///////////////使用的时候,改变flag的初始值,即可实现对灰度图、彩色图基于色彩的聚类,以及根据位置和色彩对彩色图像聚类。
////////////////最后结果显示的时候请注意pResult 和pResult3
#include "cv.h...
分类:
其他好文 时间:
2014-07-13 16:35:15
阅读次数:
463
1 概述
该瞅瞅MapReduce的内部运行原理了,以前只知道个皮毛,再不搞搞,不然怎么死的都不晓得。下文会以2.4版本中的WordCount这个经典例子作为分析的切入点,一步步来看里面到底是个什么情况。
2 为什么要使用MapReduce
Map/Reduce,是一种模式,适合解决并行计算的问题,比如TopN、贝叶斯分类等。注意,是并行计算,而非迭代计算,像涉及到层次聚类的问题就不...
分类:
其他好文 时间:
2014-07-12 21:31:22
阅读次数:
296