实际上,您可以把索引理解为一种特殊的目录。微软的SQL SERVER提供了两种索引:聚集索引(clustered index,也称聚类索引、簇集索引)和非聚集索引(nonclustered index,也称非聚类索引、非簇集索引)。下面,我们举例来说明一下聚集索引和非聚集索引的区别: 其实,我们.....
分类:
其他好文 时间:
2016-01-08 13:22:14
阅读次数:
143
一、Otsu算法原理Otsu算法(大津法或最大类间方差法)使用的是聚类的思想,把图像的灰度数按灰度级分成2个部分,使得两个部分之间的灰度值差异最大,每个部分之间的灰度差异最小,通过方差的计算来寻找一个合适的灰度级别来划分。 所以可以在二值化的时候采用otsu算法来自动选取阈值进行二值化。otsu算法...
分类:
编程语言 时间:
2016-01-08 00:27:23
阅读次数:
331
程序流程图:
Hierarchical(MIN)核心功能函数,采用vector >::dTable存储两点之间的距离。计算每两个point间的距离并保存到distance table中;判断是否达到需要聚类的cluster数量,若是,将point信息写入clustering文件,程序结束。否则,合并两个具有最小距离的point,将两个point中的所有node全部加入到一个point...
分类:
编程语言 时间:
2015-12-31 12:55:47
阅读次数:
245
程序流程图:
DBSCAN核心功能函数,计算每个point的eps范围内的point数量pts;
对于所有pts >Minpts的point,记为Core point;
对于所有的corepoint,将其eps范围内的core point下标添加到vector::corepts中;
对于所有的corepoint,采用深度优先的方式遍历core point的所有cluster,使...
分类:
数据库 时间:
2015-12-31 12:55:01
阅读次数:
376
大数据算法的摘抄预处理抽取清洗分析方法聚合:聚类类似于分类,但与分类的目的不同,是针对数据的相似性和差异性将一组数据分为几个类别。属于同一类别的数据间的相似性很大,但不同类别之间数据的相似性很小,跨类的数据关联性很低。分类:分类是找出数据库中的一组数据对象的共同特点并按照分类模式将其划分为不同的类,...
分类:
编程语言 时间:
2015-12-28 11:57:54
阅读次数:
198
广义上讲,任何在学习过程中应用到矩阵特征值分解的方法均叫做谱学习方法,比如主成分分析(PCA),线性判别成分分析(LDA),流形学习中的谱嵌入方法,谱聚类等等。 由于科苑向世明老师课件上面关于ng的谱聚类算法里面与ng大神的论文中写到的算法中有所出入,导致昨天晚上调了一晚上的算法并没有调出满...
分类:
编程语言 时间:
2015-12-28 00:47:42
阅读次数:
407
【机器学习】K-Means 聚类是特殊的矩阵分解问题。
本博客是该论文《k-Means Clustering Is Matrix Factorization》的阅读笔记。论文证明了传统的K-Means算法的目标函数可以被表达成数据矩阵与其低阶数据矩阵之间差异的Frobenius范数。简单地说,K-Means 聚类是特殊的矩阵分解问题。...
分类:
其他好文 时间:
2015-12-26 19:43:15
阅读次数:
367
这篇文章主要是爬取百度5A景区摘要信息,再利用Jieba分词工具进行中文分词,最后提出文本聚类算法的一些概念知识。一. Selenium爬取百度百科摘要 二. Jieba中文分词 1.安装及入门介绍 2.添加自定义词典 3.关键词提取 4.对百度百科获取摘要分词 5.去除停用词 三. 基于VSM的文...
分类:
编程语言 时间:
2015-12-18 06:49:30
阅读次数:
8948
如果说K-means和GMM这些聚类的方法是古代流行的算法的话,那么这次要讲的 Spectral Clustering 就可以算是现代流行的算法了,中文通常称为“谱聚类”。由于使用的矩阵的细微差别,谱聚类实际上可以说是一“类”算法。Spectral Clustering 和传统的聚类方法(例如 K-...
分类:
其他好文 时间:
2015-12-17 22:17:50
阅读次数:
306
系列不小心又拖了好久,其实正儿八经的 blog 也好久没有写了,因为比较忙嘛,不过觉得 Hierarchical Clustering 这个话题我能说的东西应该不多,所以还是先写了吧(我准备这次一个公式都不贴)。Hierarchical Clustering 正如它字面上的意思那样,是层次化的聚类,...
分类:
其他好文 时间:
2015-12-17 22:15:24
阅读次数:
238