码迷,mamicode.com
首页 >  
搜索关键字:聚类    ( 1791个结果
帮助文档-翻译-Statistics Toolbox-Exploratory Data Analysis-Cluster Analysis-Hierarchical Clustering(cluster,clusterdata)(2)
例子从样本数据中生成层次聚类树这个例子显示了如果利用样本数据生成层次聚类数,并用3维散点图展示该聚类。产生样本数据矩阵,其中的随机数由标准均匀分布(U(0,1))生成。 rng('default'); % For reproducibilty X = [gallery('uniformdata'.....
分类:其他好文   时间:2015-09-23 15:05:03    阅读次数:196
帮助文档-翻译-Statistics Toolbox-Exploratory Data Analysis-Cluster Analysis-Hierarchical Clustering(cluster,clusterdata)(1)
层次聚类Produce nested sets of clusters函数cluster根据凝聚层次聚类树构造凝聚聚类clusterdata根据样本数据构造凝聚聚类cophenetcophenet相关系数inconsistentinconsistent系数linkage凝聚层次聚类树pdist两两对...
分类:其他好文   时间:2015-09-23 13:30:19    阅读次数:250
数据挖掘-概念与技术-第10章聚类作业题
介绍基于划分的聚类方法 给定n个对象的集合,将对象划分成K个簇。每个簇至少包含一个对象。 K-Means伪代码 输入:k:簇的数目 D: 包含n个对象的数据集 输出:k个簇的集合 方法: (1) 从D中任意选择K个对象作为初始簇的中心。 (2) repeat a) 根据簇中对象的均值,将每个对象分配...
分类:其他好文   时间:2015-09-22 14:36:42    阅读次数:174
Matlab绘制透明平面
一、需求来源 对空间结构聚类,恰好是圆台,找到了上下底面的方程,所以画图。二、需求解决2.1 绘制平面x = linspace(0,5,100);y = linspace(0,4,100);z = 2.*repmat(x,100,1) + 8.*repmat(y,100,1);surf(x,y,z....
分类:其他好文   时间:2015-09-21 01:28:30    阅读次数:334
TF-IDF算法(2)—python实现
结合之前对TF-IDF算法的分析,本文采用python对算法加以实现,并结合k-means算法实现简单的文本聚类。
分类:编程语言   时间:2015-09-21 01:20:14    阅读次数:242
k-means算法总结
1.原理 聚类是一种无监督学习的方法,其实质是依据某种距离度量,使得同一聚簇之间的相似性最大化,不同聚簇之间的相似性最小化,即把相似的对象放入同一聚簇中,把不相似的对象放到不同的聚簇中。聚类与分类不同,聚类的输入对象不需要带有类别标签,最后组成的分类是由使用的算法决定的。在聚类中,k-means由....
分类:编程语言   时间:2015-09-19 15:13:27    阅读次数:226
KMeans聚类 K值以及初始类簇中心点的选取 转
本文主要基于Anand Rajaraman和Jeffrey David Ullman合著,王斌翻译的《大数据-互联网大规模数据挖掘与分布式处理》一书。KMeans算法是最常用的聚类算法,主要思想是:在给定K值和K个初始类簇中心点的情况下,把每个点(亦即数据记录)分到离其最近的类簇中心点所代表的类簇中...
分类:其他好文   时间:2015-09-17 19:16:31    阅读次数:252
Kmeans聚类算法
K-means也是聚类算法中最简单的一种了,但是里面包含的思想却是不一般。最早我使用并实现这个算法是在学习韩爷爷那本数据挖掘的书中,那本书比较注重应用。看了Andrew Ng的这个讲义后才有些明白K-means后面包含的EM思想。 聚类属于无监督学习,以往的回归、朴素贝叶斯、SVM等都是有类别标签....
分类:编程语言   时间:2015-09-17 11:44:08    阅读次数:255
主题模型之概率潜在语义分析(Probabilistic Latent Semantic Analysis)
上一篇总结了潜在语义分析(Latent Semantic Analysis, LSA),LSA主要使用了线性代数中奇异值分解的方法,但是并没有严格的概率推导,由于文本文档的维度往往很高,如果在主题聚类中单纯的使用奇异值分解计算复杂度会很高,使用概率推导可以使用一些优化迭代算法来求解。Thomas H...
分类:其他好文   时间:2015-09-17 09:54:46    阅读次数:300
K Nearest Neighbor 算法
K Nearest Neighbor算法又叫KNN算法,这个算法是机器学习里面一个比较经典的算法,总体来说KNN算法是相对比较容易理解的算法。其中的K表示最接近自己的K个数据样本。KNN算法和K-Means算法不同的是,K-Means算法用来聚类,用来判断哪些东西是一个比较相近的类型,而KNN算法是...
分类:编程语言   时间:2015-09-17 06:27:41    阅读次数:302
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!