码迷,mamicode.com
首页 >  
搜索关键字:clustering    ( 336个结果
K-Means聚类
聚类(clustering) 用于找出不带标签数据的相似性的算法 K-Means聚类算法简介 与广义线性模型和决策树类似,K-Means参 数的最优解也是以成本函数最小化为目标。K-Means成本函数公式如下: 成本函数是各个类畸变程度(distortions)之和。每个类的畸变程度等于 该类重心与 ...
分类:其他好文   时间:2017-09-06 23:54:17    阅读次数:298
层级聚类(Hierarchical Clustering)
#!/usr/bin/env python # -*- coding: utf-8 -*- from numpy import * """ Code for hierarchical clustering, modified from Programming Collective Intellige... ...
分类:其他好文   时间:2017-09-03 22:10:51    阅读次数:197
python实现一个层次聚类方法
层次聚类(Hierarchical Clustering) 一.概念 层次聚类不需要指定聚类的数目,首先它是将数据中的每个实例看作一个类,然后将最相似的两个类合并,该过程迭代计算只到剩下一个类为止,类由两个子类构成,每个子类又由更小的两个子类构成。如下图所示: 二.合并方法 在聚类中每次迭代都将两个 ...
分类:编程语言   时间:2017-08-11 14:39:30    阅读次数:344
谱聚类(转)
Spectral Clustering 算法的全貌: 1)根据数据构造一个 Graph ,Graph 的每一个节点对应一个数据点,将相似的点连接起来,并且边的权重用于表示数据之间的相似度。把这个 Graph 用邻接矩阵的形式表示出来,记为 W 。 2)把每一列元素加起来得到N 个数,把它们放在对角线 ...
分类:其他好文   时间:2017-08-04 20:37:23    阅读次数:124
聚类:(K-means)算法
1.归类: 聚类(clustering) 属于非监督学习 (unsupervised learning) 无类别标记(class label) 2.举例: 3. K-means 算法: 3.1 Clustering 中的经典算法,数据挖掘十大经典算法之一 3.2 算法接受参数 k ;然后将事先输入的 ...
分类:编程语言   时间:2017-08-03 00:50:57    阅读次数:175
How to convert matrix to RDD[Vector] in spark
The matrix is generated from SVD, and I am using the results from SVD to do clustering analysis. if your clustering only supports RDD as its input, he ...
分类:其他好文   时间:2017-07-21 11:38:10    阅读次数:176
scRNA-seq单细胞测序数据分析工具汇总
本文总结自一篇综述: Computational approaches for interpreting scRNA-seq data 单细胞分析分为两个层次: cell level gene level Tools for the visualization and clustering of c... ...
分类:其他好文   时间:2017-07-12 19:59:47    阅读次数:421
基于K-means Clustering聚类算法对电商商户进行级别划分(含Octave仿真)
在从事电商做频道运营时,每到关键时间节点,大促前,季度末等等,我们要做的一件事情就是品牌池打分,更新所有店铺的等级。例如,所以的商户分入SKA,KA,普通店铺,新店铺这4个级别,对于不同级别的商户,会给予不同程度的流量扶持或广告策略。通常来讲,在一定时间段内,评估的维度可以有:UV,收订金额,好评率 ...
分类:编程语言   时间:2017-07-05 18:04:06    阅读次数:369
【机器学习】DBSCAN Algorithms基于密度的聚类算法
一、算法思想: DBSCAN(Density-Based Spatial Clustering of Applications with Noise)是一个比较有代表性的基于密度的聚类算法。与划分和层次聚类方法不同,它将簇定义为密度相连的点的最大集合,能够把具有足够高密度的区域划分为簇,并可在噪声的 ...
分类:数据库   时间:2017-06-20 11:36:44    阅读次数:236
Clustering by fast search and find of desity peaks(基于快速搜索与寻找密度峰值的聚类)
基于快速搜索与寻找密度峰值的聚类(Alex Rodriguez and Alessandro Laio) 摘要:聚类分析目的是基于元素之间的相似度对其进行分类,应用范围从天文学到生物信息学、文献计量学到模式识别。我们提出一种方法,思想基于簇中心具有比其邻居更大密度的特点以及与更大密度点之间有一个相对 ...
分类:其他好文   时间:2017-06-15 23:34:07    阅读次数:1462
336条   上一页 1 ... 10 11 12 13 14 ... 34 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!