码迷,mamicode.com
首页 >  
搜索关键字:聚类算法    ( 542个结果
K-means算法原理与R语言实例
聚类是将相似对象归到同一个簇中的方法,这有点像全自动分类。簇内的对象越相似,聚类的效果越好。支持向量机、神经网络所讨论的分类问题都是有监督的学习方式,现在我们所介绍的聚类则是无监督的。其中,K均值(K-means)是最基本、最简单的聚类算法。...
分类:编程语言   时间:2016-01-23 18:30:32    阅读次数:225
mahout in Action2.2-聚类介绍-K-means聚类算法
聚类介绍 本章包括     1 实战操作了解聚类     2.了解相似性概念     3 使用mahout运行一个简单的聚类实例     4.用于聚类的各种不同的距离测算方法       作为人类,我们倾向于与志同道合的人合作—“鸟的羽毛聚集在一起。我们能够发现重复的模式通过联系在我们的记忆中的我们看到的、听到的、问道的、尝到的东 西。 例如,相比较盐 ,糖能够是我们更...
分类:编程语言   时间:2016-01-19 10:47:25    阅读次数:209
K-means算法简介
K-means 算法是无监督的 聚类算法,算法简单,有效。K-means算法:输入参数: 指定聚类数目 k,训练集 X输出 : k 个聚类算法描述: K-means 算法 是一个 迭代算法,每次迭代分成两个步骤: 1)指定聚类步骤: 计算每个样本到 k 个 聚类中心的 距离...
分类:编程语言   时间:2016-01-17 01:15:33    阅读次数:233
聚类算法-Hierarchical(MIN)-C++
程序流程图: Hierarchical(MIN)核心功能函数,采用vector >::dTable存储两点之间的距离。计算每两个point间的距离并保存到distance table中;判断是否达到需要聚类的cluster数量,若是,将point信息写入clustering文件,程序结束。否则,合并两个具有最小距离的point,将两个point中的所有node全部加入到一个point...
分类:编程语言   时间:2015-12-31 12:55:47    阅读次数:245
聚类算法-DBSCAN-C++实现
程序流程图: DBSCAN核心功能函数,计算每个point的eps范围内的point数量pts; 对于所有pts >Minpts的point,记为Core point; 对于所有的corepoint,将其eps范围内的core point下标添加到vector::corepts中; 对于所有的corepoint,采用深度优先的方式遍历core point的所有cluster,使...
分类:数据库   时间:2015-12-31 12:55:01    阅读次数:376
关于谱聚类的ng算法的实现
广义上讲,任何在学习过程中应用到矩阵特征值分解的方法均叫做谱学习方法,比如主成分分析(PCA),线性判别成分分析(LDA),流形学习中的谱嵌入方法,谱聚类等等。 由于科苑向世明老师课件上面关于ng的谱聚类算法里面与ng大神的论文中写到的算法中有所出入,导致昨天晚上调了一晚上的算法并没有调出满...
分类:编程语言   时间:2015-12-28 00:47:42    阅读次数:407
[python] 使用Jieba工具中文分词及文本聚类概念
这篇文章主要是爬取百度5A景区摘要信息,再利用Jieba分词工具进行中文分词,最后提出文本聚类算法的一些概念知识。一. Selenium爬取百度百科摘要 二. Jieba中文分词 1.安装及入门介绍 2.添加自定义词典 3.关键词提取 4.对百度百科获取摘要分词 5.去除停用词 三. 基于VSM的文...
分类:编程语言   时间:2015-12-18 06:49:30    阅读次数:8948
算法之常用的距离和相似度度量
在数据分析和数据挖掘的过程中,我们经常需要知道个体间差异的大小,进而评价个体的相似性和类别。最常见的是数据分析中的相关分析,数据挖掘中的分类和聚类算法,如K最近邻(KNN)和K均值(K-Means)。当然衡量个体差异的方法有很多,这里整理罗列下。 为了方便下面的解释和举例,先设定我们要比较X个...
分类:编程语言   时间:2015-12-01 12:52:40    阅读次数:189
Python实现K-means聚类算法
因为自己对python也有一定的了解,之前也用R做过一些数据分析,又恰好看到几篇文章介绍python实现算法的,觉得挺有意思,所以参考了一些书籍来自己实现一个K-means的聚类算法。《Python数据分析基础教程:NumPy学习指南(第2版)》和 《 Matplotlib手册》是做数据分析的挺不错...
分类:编程语言   时间:2015-11-23 18:41:18    阅读次数:782
文本挖掘之文本聚类(OPTICS)
鉴于DBSCAN算法对输入参数,领域半径E和阈值M比较敏感,在参数调优时比较麻烦,因此本文对另一种基于密度的聚类算法OPTICS(Ordering Points To Identify the Clustering Structure)展开研究,其为DBSCAN的改进算法,与DBSCAN相比,该算法...
分类:其他好文   时间:2015-11-09 20:39:59    阅读次数:312
542条   上一页 1 ... 34 35 36 37 38 ... 55 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!