码迷,mamicode.com
首页 >  
搜索关键字:聚类    ( 1791个结果
谱聚类(转)
Spectral Clustering 算法的全貌: 1)根据数据构造一个 Graph ,Graph 的每一个节点对应一个数据点,将相似的点连接起来,并且边的权重用于表示数据之间的相似度。把这个 Graph 用邻接矩阵的形式表示出来,记为 W 。 2)把每一列元素加起来得到N 个数,把它们放在对角线 ...
分类:其他好文   时间:2017-08-04 20:37:23    阅读次数:124
在R中练习k-meas聚类
算法优势:适用于绝大多数的数据类型,简洁和快速 算法劣势:需要知道准确的 k 值,并且不能处理异形簇,比如球形簇,不同尺寸及密度的簇,环形簇等。 一、分析目标 以数据集字段进行客户分群 二、流程 数据获取,毕业年份、性别、年龄、交友数量、关注的热点词(原本是一个list是否关注了这些运动或者热点词, ...
分类:其他好文   时间:2017-08-04 13:52:03    阅读次数:240
聚类:层次聚类
假设有N个待聚类的样本,对于层次聚类来说,步骤: 1、(初始化)把每个样本归为一类,计算每两个类之间的距离,也就是样本与样本之间的相似度; 2、寻找各个类之间最近的两个类,把他们归为一类(这样类的总数就少了一个); 3、重新计算新生成的这个类与各个旧类之间的相似度; 4、重复2和3直到所有样本点都归 ...
分类:其他好文   时间:2017-08-03 01:04:39    阅读次数:146
扩增子图表解读3热图:差异菌、OTU及功能
热图是使用颜色来展示数值矩阵的图形。通常还会结合行、列的聚类分析,以表达实验数据多方面的结果。 热图在生物学领域应用广泛,尤其在高通量测序的结果展示中很流行,如样品-基因表达,样品-OTU相对丰度矩阵非常适合采用热图呈现。 热图优点 因为人读数字需要思考和比较,而对颜色识别能力非常强,采用颜色的深浅 ...
分类:其他好文   时间:2017-08-03 00:54:06    阅读次数:1870
聚类:(K-means)算法
1.归类: 聚类(clustering) 属于非监督学习 (unsupervised learning) 无类别标记(class label) 2.举例: 3. K-means 算法: 3.1 Clustering 中的经典算法,数据挖掘十大经典算法之一 3.2 算法接受参数 k ;然后将事先输入的 ...
分类:编程语言   时间:2017-08-03 00:50:57    阅读次数:175
大数据系列之Hadoop框架
Hadoop框架中,有很多优秀的工具,帮助我们解决工作中的问题。 Hadoop的位置 从上图可以看出,越往右,实时性越高,越往上,涉及到算法等越多。 越往上,越往右就越火…… Hadoop框架中一些简介 HDFS HDFS,(Hadoop Distributed File System) hadoo ...
分类:其他好文   时间:2017-08-02 14:24:01    阅读次数:123
测试数据科学家聚类技术的40个问题(附答案和分析)(转)
本文作者 Saurav Kaushik 是数据科学爱好者,还有一年他就从新德里 MAIT 毕业了,喜欢使用机器学习和分析来解决复杂的数据问题。看看以下40道题目,测试下你能答对多少。 作者 | Saurav Kaushik 翻译 | AI科技大本营(rgznai100) 介绍 创造出具有自我学习能力 ...
分类:其他好文   时间:2017-07-29 19:34:04    阅读次数:177
机器学习方法--分类、回归、聚类
原创 2017-07-27 马文辉 MATLAB 作 者 简 介 马文辉,MathWorks中国应用工程师, 南开大学工学博士,在大数据处理与分析领域有多年研究与开发经验;曾就职于Nokia中国研究院,Adobe中国研发中心以及IBM中国。 近年来,全国赛的题目中,多多少少都有些数据,而且数据量总体 ...
分类:其他好文   时间:2017-07-29 00:51:24    阅读次数:399
7月份总结,8月到9月15日 大体计划
7月30之前做了什么 监督学习的常见算法,如决策树,SVM,GLM,naive bayes,非监督算法,k-means,kNN 相关的概率论知识补充,除神经网络与深度学习外的资料收集,对脑机研究的基本了解,对整体机器学习,深度学习,数据挖掘这块宏观的认识 接下来还需要继续学习的有: 1.继续传统机器 ...
分类:其他好文   时间:2017-07-28 14:07:47    阅读次数:154
从零开始学习weka数据挖掘
作为一个免费、公开、开源的数据挖掘工作平台,Weka集合了大量能承担数据挖掘任务的机器学习算法,包括预处理、分类、回归、聚类、关联规则以及在新的交互式界面上的可视化操作等;目前,Weka最新版本为weka-3-7-11,可以利用weka进行大数据的挖掘和分析处理。WEKA的全名是怀卡..
分类:其他好文   时间:2017-07-28 13:30:57    阅读次数:142
1791条   上一页 1 ... 84 85 86 87 88 ... 180 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!