码迷,mamicode.com
首页 >  
搜索关键字:聚类    ( 1791个结果
机器学习公开课笔记(8):k-means聚类和PCA降维
K-Means算法非监督式学习对一组无标签的数据试图发现其内在的结构,主要用途包括:市场划分(Market Segmentation)社交网络分析(Social Network Analysis)管理计算机集群(Organize Computer Clusters)天文学数据分析(Astronomi...
分类:其他好文   时间:2016-01-20 22:12:07    阅读次数:844
mahout in Action2.2-聚类介绍-K-means聚类算法
聚类介绍 本章包括     1 实战操作了解聚类     2.了解相似性概念     3 使用mahout运行一个简单的聚类实例     4.用于聚类的各种不同的距离测算方法       作为人类,我们倾向于与志同道合的人合作—“鸟的羽毛聚集在一起。我们能够发现重复的模式通过联系在我们的记忆中的我们看到的、听到的、问道的、尝到的东 西。 例如,相比较盐 ,糖能够是我们更...
分类:编程语言   时间:2016-01-19 10:47:25    阅读次数:209
Mahout聚类和kafaka相关知识
1.说几种距离测度Mahout:欧式距离测度;平方欧式距离测度;曼哈顿距离测度;余弦距离测度;加权距离测度2.K-means算法参数:3.TF-IDF加权公式:4.聚类是什么?聚类是一种无监督的机器学习任务,可以自动将数据划分成类cluster。并不需要提前告知所划分的组是什么样的,因为我们可能都不...
分类:其他好文   时间:2016-01-18 22:20:54    阅读次数:339
octave之奇巧淫技向量化计算实现寻找样本点所属聚类下标
前面有文章提到过,K-means算法,第一步骤是找出样本点的的所属聚类。下面用两种方式实现,一种是普通的循环,一种是完全向量化计算。 假设 : X 是m×n样本矩阵,其每一行是一个样本,m表示样本数目,n表示特征数目; centroids是K×n矩阵,K表示聚类数目,n表示特征数目...
分类:其他好文   时间:2016-01-17 21:38:05    阅读次数:216
K-means算法简介
K-means 算法是无监督的 聚类算法,算法简单,有效。K-means算法:输入参数: 指定聚类数目 k,训练集 X输出 : k 个聚类算法描述: K-means 算法 是一个 迭代算法,每次迭代分成两个步骤: 1)指定聚类步骤: 计算每个样本到 k 个 聚类中心的 距离...
分类:编程语言   时间:2016-01-17 01:15:33    阅读次数:233
FPGA机器学习之学习的方向
经过了2个月对机器学习的了解后。我发现了,机器学习的方向多种多样。网页排序。语音识别,图像识别,推荐系统等。算法也多种多样。看见其它的书后,我发现除了讲到的k均值聚类。贝叶斯,神经网络,在线学习等等,还有非常多其它的算法。比方说:免疫算法,遗传算法,主成分分析。蚁群算法等等。好像非常多算法都是须要....
分类:其他好文   时间:2016-01-13 23:20:45    阅读次数:304
【数据库】 索引 index
数据页可以有两种存储方式:聚类存储(clusterd storage)和非聚类存储(interleaved storage)。一个表有很多属性,索引基于某个属性。例子:att1 att2 att3name2 3 x1name1 4 x5name3 1 x21.有序索引 (sor...
分类:数据库   时间:2016-01-12 11:55:06    阅读次数:164
对需要聚类的数据使用canopy做初步的计算
K值聚类的时候,需要自己指定cluster的数目。这个cluster数目一般是通过canopy算法进行预处理来确定的。canopy具体描述可以参考这里。下面是 golang语言的一个实现(对经纬度距离计算进行cluster)。package mainimport ( "fmt" "mat...
分类:其他好文   时间:2016-01-11 12:14:43    阅读次数:226
探索推荐引擎内部的秘密,第 3 部分: 深入推荐引擎相关算法 - 聚类
聚类分析 什么是聚类分析? 聚类 (Clustering) 就是将数据对象分组成为多个类或者簇 (Cluster),它的目标是:在同一个簇中的对象之间具有较高的相似度,而不同簇中的对象差别较大。所以,在很多应用中,一个簇中的数据对象可以被作为一个整体来对待,从而减少计算量或者提高计算质量。 其实聚类...
分类:编程语言   时间:2016-01-08 20:22:12    阅读次数:211
探索推荐引擎内部的秘密,第 1 部分: 推荐引擎初探
“探索推荐引擎内部的秘密”系列将带领读者从浅入深的学习探索推荐引擎的机制,实现方法,其中还涉及一些基本的优化方法,例如聚类和分类的应用。同时在理论讲解的基础上,还会结合 Apache Mahout 介绍如何在大规模数据上实现各种推荐策略,进行策略优化,构建高效的推荐引擎的方法。本文作为这个系列的第一...
分类:其他好文   时间:2016-01-08 20:18:40    阅读次数:181
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!