目前,SPARK在大数据处理领域十分流行。尤其是对于大规模数据集上的机器学习算法,SPARK更具有优势。一下初步介绍SPARK在linux中的部署与使用,以及其中聚类算法的实现。...
分类:
编程语言 时间:
2014-11-12 21:21:04
阅读次数:
264
rcnn开创性工作,但是计算时间太长,重复计算太大。spp_net将重复计算避免了。hcp是yan shuicheng那边的,是用bing生成regions,然后用normalized cut将这些regions进行聚类,然后将聚类后剩下较小数量的regions进cnn,其实整体思路也是rcnn,只...
分类:
Web程序 时间:
2014-11-10 11:49:03
阅读次数:
250
Clojure数据分析秘笈
目录
1
导入分析数据2
清洗和校验数据3
使用并发编程管理复杂度4
使用并行编程提高性能5
Cascalog6
使用Incanter数据集7
使用Incanter准备并执行数据分析8
使用Mathematica和R9
聚类、分类和使用Weka10
使用Incanter绘图11
创建网页图表
导入分析数据
...
分类:
其他好文 时间:
2014-11-10 10:02:17
阅读次数:
241
Mean Shift,我们 翻译为“均值飘移”。其在聚类,图像平滑。图像切割和跟踪方面得到了比較广泛的应用。因为本人眼下研究跟踪方面的东西,故此主要介绍利用Mean Shift方法进行目标跟踪,从而对MeanShift有一个比較全面的介绍。 (下面某些部分转载常峰学长的“Mean Shift概述”)...
分类:
其他好文 时间:
2014-11-09 16:34:18
阅读次数:
343
在 聚类算法K-Means, K-Medoids, GMM, Spectral clustering,Ncut一文中我们给出了GMM算法的基本模型与似然函数,在EM算法原理中对EM算法的实现与收敛性证明进行了具体说明。本文主要针对怎样用EM算法在混合高斯模型下进行聚类进行代码上的分析说明。1. GM...
分类:
编程语言 时间:
2014-11-09 15:08:43
阅读次数:
348
Arcgis for JS扩展GraphicLayer实现区域对象的聚类统计与展示...
分类:
Web程序 时间:
2014-11-06 23:40:46
阅读次数:
502
K-means算法
一般情况,聚类算法可以划分为以下几类:划分方法(partitioning method)、层次方法(hierarchical
methods)、基于密度的方法(density-based methods)、基于网格的方法(grid-based methods)、基于模型的方法(model-based
methods).k-means算法属于划分方法中的一种。 K-me...
分类:
编程语言 时间:
2014-11-05 13:05:07
阅读次数:
307
将一群物理对象或者抽象对象的划分成相似的对象类的过程。其中类簇是数据对象的集合,在类簇中所有的对象都彼此相似,而类簇与类簇之间的对象是彼此相异。聚类除了可以用于数据分割(data segmentation),也可以用于离群点检测(outlier
detection),所谓的离群点指的是与“普通”点相对应的“异常”点,而这些“异常”点往往值的注意。
很多人在学习聚类之初,容易将...
分类:
其他好文 时间:
2014-11-05 13:04:06
阅读次数:
252
前面介绍了k-means算法,并列举了该算法的缺点。而K中心点算法(K-medoids)正好能解决k-means算法中的 “噪声”敏感这个问题。
如何解决的呢?
首先,我们得介绍下k-means算法为什么会对“噪声”敏感。还记得K-means寻找质点的过程吗?对某类簇中所有的样本点维度求平均值,即获得该类簇质点的维度。当聚类的样本点中有“噪声”(离群点)时,在计算类簇质点的过程中会受到...
分类:
编程语言 时间:
2014-11-05 13:02:45
阅读次数:
204