AP聚类算法是基于数据点间的"信息传递"的一种聚类算法。与k-均值算法或k中心点算法不同,AP算法不需要在运行算法之前确定聚类的个数。AP算法寻找的"examplars"即聚类中心点是数据集合中实际存在的点,作为每类的代表。算法描述: 假设$\{ {x_1},{x_2}, \cdots ,{x_.....
分类:
编程语言 时间:
2015-01-05 00:21:46
阅读次数:
1414
1Unsupervised Learning1.1k-means clustering algorithm1.1.1算法思想1.1.2k-means的不足之处1.1.3如何选择K值1.1.4Spark MLlib 实现 k-means 算法1.2Mixture of Gaussians and th...
分类:
系统相关 时间:
2014-12-23 10:15:28
阅读次数:
416
第n-k大曼哈顿距离,莫队算法裸题
Object Clustering
Time Limit: 2000MS
Memory Limit: 131072K
Total Submissions: 1584
Accepted: 366
第n-k大曼哈顿距离,莫队算法裸题
Description
We have N (N ≤ 10000)...
分类:
编程语言 时间:
2014-12-20 02:09:10
阅读次数:
246
文本特征提取
词袋(Bag of Words)表征
文本分析是机器学习算法的主要应用领域。但是,文本分析的原始数据无法直接丢给算法,这些原始数据是一组符号,因为大多数算法期望的输入是固定长度的数值特征向量而不是不同长度的文本文件。为了解决这个问题,scikit-learn提供了一些实用工具可以用最常见的方式从文本内容中抽取数值特征,比如说:
标记(tokenizing)文本以及为每一...
分类:
其他好文 时间:
2014-12-16 11:46:54
阅读次数:
203
今天继续和小伙伴们分享聚类算法和R语言的实现,上篇和大家分享了聚类中的距离、类间距离和最古典的层次聚类法,今天和大家分享几个动态聚类算法。
首先和大家分享被评为十大数据挖掘算法之一的K-means 算法(K为分类的个数,mean为平均值,该算法的难点即为K的指点)
Step1:选择K个点作为初始质心;
Step2:将剩余每个点指派到最近的质心,形成K个簇(聚类);
Step3:重新计算簇的...
分类:
编程语言 时间:
2014-12-12 11:47:35
阅读次数:
277
先说平台: win7 x64,matlab 2012a x64,亲测运行。 ncut 是个图像切割方法,以后再回顾具体算法吧,网上很多流程的是Jianbo Shi 这位2000年写的,名字应该是:Data Clustering with Normalized Cuts 问题是普遍流行是他200...
分类:
其他好文 时间:
2014-12-04 23:06:55
阅读次数:
534
这次介绍的是Alex和Alessandro于2014年发表在的Science上的一篇关于聚类的文章[13],该文章的基本思想很简单,但是其聚类效果却兼具了谱聚类(Spectral Clustering)[11,14,15]和K-Means的特点,着实激起了我的极大的兴趣,该聚类算法主要是基于两个基本...
分类:
其他好文 时间:
2014-12-04 21:30:15
阅读次数:
281
3 Common issues of fail-over clustering configuration....
分类:
其他好文 时间:
2014-12-01 20:55:10
阅读次数:
205
By admin on May 29, 2011 ? ? I have been working on clustering code improvements in the Tigase server for last a few months to make it more reliable and better scale. In article about XMPP Servic...
分类:
Web程序 时间:
2014-11-21 12:49:18
阅读次数:
272
1.集群因子的算法:通过dbms_rowid.rowid_block_number(rowid)找到记录对应的block号。索引中记录了rowid,因此oracle就可以根据索引中的rowid来判断记录是否是在同一个block中。举个例子,比如说索引中有a,b,c,d,e五个记录,首先比较a,b是否...
分类:
数据库 时间:
2014-11-19 15:32:38
阅读次数:
279