码迷,mamicode.com
首页 >  
搜索关键字:聚类 k-meas k均值    ( 1791个结果
非零点之间聚类
在二值图像中,非零点之间的进行聚类,使用矩形框进行标记其区域过程中,主要解决相邻的两个矩形框之间重叠区域和嵌套现象。仅作参考.注:因开发周期只有几个小时地时间.代码有不规范地方,请各位见谅.关于Image Engineering& Computer Vision更多讨论与交流,敬请关注本博客和新浪微博songzi_tea....
分类:其他好文   时间:2014-08-10 13:02:10    阅读次数:239
初识聚类算法:K均值、凝聚层次聚类和DBSCAN
原文地址http://blog.sina.com.cn/s/blog_62186b460101ard2.html这里只是将比较重要的部分转一下另外还有一篇关于层次聚类的http://blog.csdn.net/jwh_bupt/article/details/7685809聚类分析就仅根据在数据中发...
分类:数据库   时间:2014-08-08 17:40:26    阅读次数:425
【数据挖掘技术】聚类分析
聚类(Clustering)分析有一个通俗的解释和比喻,那就是“物以类聚,人以群分”。针对几个特定的业务指标,可以将观察对象的群体按照相似性和相异性进行不同群组的划分。经过划分后,每个群组内部个对象间的相似度会很高,而在不同群组之间的对象彼此间将具有很高的相异度。 聚类技术一方面本身就是一种...
分类:其他好文   时间:2014-08-06 01:52:50    阅读次数:203
EM 算法
这个暂时还不太明白,先写一点明白的。EM:最大期望算法,属于基于模型的聚类算法。是对似然函数的进一步应用。我们知道,当我们想要估计某个分布的未知值,可以使用样本结果来进行似然估计,进而求最大似然估计就可以估计出要求的参数。但是有时候还会有未知参数,这样就不能使用极大似然估计。当然这个参数与我们要估计...
分类:其他好文   时间:2014-08-05 18:17:09    阅读次数:180
mahout聚类1
聚类: 是否可以将事物归为一个簇,完全取决于我们在考量它们之间相似性时所选择的特征参数。 聚类,就是将一个给定文档中的相似项目分成不同簇的过程,我们可以将这些簇看做一组簇内相似而簇间有别的项目的集合。 1、一个算法,将书组织在一起的方法 2、相似性和不相似性的概念 3、停止的条件 簇的中...
分类:其他好文   时间:2014-08-04 17:08:07    阅读次数:172
数据聚类------GMM
我们来说一下另一个很流行的算法:Gaussian Mixture Model (GMM)。事实上,GMM 和 k-means 很像,不过 GMM 是学习出一些概率密度函数来(所以 GMM 除了用在 clustering 上之外,还经常被用于 density estimation ),简单地说,k-m...
分类:其他好文   时间:2014-08-04 16:57:17    阅读次数:295
数据聚类-----medoids
前一篇我们了解了一个最基本的 clustering 办法 k-means ,这次要说的 k-medoids 算法,其实从名字上就可以看出来,和 k-means 肯定是非常相似的。事实也确实如此,k-medoids 可以算是 k-means 的一个变种。 k-medoids 和 k-mean...
分类:其他好文   时间:2014-08-04 16:54:17    阅读次数:232
借助均移确定聚类中心
均移:指偏移的均值向量,是一种非参数技术 主要思想:首先随机选择一个初始的感兴趣区域(初始窗)并确定其重心,接下来,搜索周围点密度更大的感兴趣区域并确定其重心 重复上面的过程不断将均值移动直到收敛。均移方法中,需要确定多变量密度核估计器。其中,核函数的作用是是的随着特征点与均值的距离不同,对均值的便...
分类:其他好文   时间:2014-07-28 23:31:34    阅读次数:278
[模式识别].(希腊)西奥多里蒂斯<第四版>笔记10之__聚类:基本概念
一,引言 之前几个章节讨论的都是监督聚类,从本章开始讨论非监督聚类,即训练模式不带标签的情形。     聚类的步骤: 1,特征选择。选取最能够表示我们目标物体信息的特征。 2,相似性度量。给出两个特征量相似点或者不想似的地方。 3,聚类标准。聚类标准。可能由损耗函数(cost function)或者其他形式表达。 4,聚类算法。根据相似性度量和聚类标准,阐明数据的结构。 5,...
分类:其他好文   时间:2014-07-28 16:10:33    阅读次数:181
数据挖掘算法学习(一)K-Means算法
算法简介: K-Means算法是输入聚类个数k,以及包含n个数据对象的数据库,输出满足方差最小标准的k个聚类。并使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中 对象相似度较小。 算法假设: 均方误差是计算群组分散度的最佳参数。 算法输入: 聚类个数k;...
分类:其他好文   时间:2014-07-28 00:03:39    阅读次数:343
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!