码迷,mamicode.com
首页 >  
搜索关键字:聚类    ( 1791个结果
二分K-means算法
二分K-means聚类(bisecting K-means)算法优缺点:由于这个是K-means的改进算法,所以优缺点与之相同。算法思想:1.要了解这个首先应该了解K-means算法,可以看这里这个算法的思想是:首先将所有点作为一个簇,然后将该簇一分为二。之后选择能最大程度降低聚类代价函数(也就是误...
分类:编程语言   时间:2014-11-29 01:31:25    阅读次数:618
常见的聚类算法
1.K-means算法K-means算法是硬聚类算法,是典型的基于原型的目标函数聚类方法的代表,它是数据点到原型的某种距离作为优化的目标函数,利用函数求极值的方法得到迭代运算的调整规则。K-means算法以欧式距离作为相似度测度,它是求对应某一初始聚类中心向量V最优分类,使得评价指标J最小。算法采用...
分类:编程语言   时间:2014-11-28 17:45:43    阅读次数:220
k-means聚类算法python实现
K-means聚类算法算法优缺点:优点:容易实现缺点:可能收敛到局部最小值,在大规模数据集上收敛较慢使用数据类型:数值型数据算法思想k-means算法实际上就是通过计算不同样本间的距离来判断他们的相近关系的,相近的就会放到同一个类别中去。1.首先我们需要选择一个k值,也就是我们希望把数据分成多少类,...
分类:编程语言   时间:2014-11-28 06:13:30    阅读次数:368
《BI那点儿事》Microsoft 聚类分析算法——三国人物身份划分
什么是聚类分析?聚类分析属于探索性的数据分析方法。通常,我们利用聚类分析将看似无序的对象进行分组、归类,以达到更好地理解研究对象的目的。聚类结果要求组内对象相似性较高,组间对象相似性较低。在三国数据分析中,很多问题可以借助聚类分析来解决,比如三国人物身份划分。聚类分析的基本过程是怎样的?选择聚类变量...
分类:编程语言   时间:2014-11-25 23:00:37    阅读次数:324
一种简化的密度聚类方法
先说一下什么是密度聚类的方法参考文章:基于密度的聚类 这篇文章的大概意思通过一幅图来说明: 1 首先任意选定一个点假设就以图中最左边的h为第一个点,根据半径判断,在一定的范围内点的个数是否满足要求。 -如果满足把这个点标记为核心点,这个圆判定为一个聚类。 -如果不是,就把这个点判定为...
分类:其他好文   时间:2014-11-20 21:44:36    阅读次数:688
聚类算法:K-means 算法(k均值算法)
k-means算法: 第一步:选$K$个初始聚类中心,$z_1(1),z_2(1),\cdots,z_k(1)$,其中括号内的序号为寻找聚类中心的迭代运算的次序号.聚类中心的向量值可任意设定,例如可选开始的$K$个模式样本的向量值作为初始聚类中心。 第二步:逐个将需分类的模式样本$\{x\}$按.....
分类:编程语言   时间:2014-11-16 21:29:00    阅读次数:257
聚类算法:ISODATA算法
1. 与K-均值算法的比较–K-均值算法通常适合于分类数目已知的聚类,而ISODATA算法则更加灵活;–从算法角度看, ISODATA算法与K-均值算法相似,聚类中心都是通过样本均值的迭代运算来决定的;–ISODATA算法加入了一些试探步骤,并且可以结合成人机交互的结构,使其能利用中间结果所取得的经...
分类:编程语言   时间:2014-11-16 15:53:14    阅读次数:378
探索推荐引擎内部的秘密,第 3 部分: 深入推荐引擎相关算法 - 聚类(四)
狄利克雷聚类算法 前面介绍的三种聚类算法都是基于划分的,下面我们简要介绍一个基于概率分布模型的聚类算法,狄利克雷聚类(Dirichlet Processes Clustering)。 首先我们先简要介绍一下基于概率分布模型的聚类算...
分类:编程语言   时间:2014-11-13 16:57:10    阅读次数:306
Word2vec 浅谈
本人还没有做过自然语言处理,但是基于Deep Learning 的关注,自然也了解了一些Word2vec的强大。       Word2vec 是google 在2013年提供的一款将词表征为实数值向量的高效工具。而Word2vec 输出的词向量可用于做NLP 相关的工作,比如聚类、找同义词、词性分析等。Word2vec 大受欢迎的一个原因是其高效性, Tomas Mikolov  在[1]...
分类:其他好文   时间:2014-11-13 16:47:26    阅读次数:192
探索推荐引擎内部的秘密,第 3 部分: 深入推荐引擎相关算法 - 聚类(二)
K 均值聚类算法 K 均值是典型的基于距离的排他的划分方法:给定一个 n 个对象的数据集,它可以构建数据的 k 个划分,每个划分就是一个聚类,并且 k<=n,同时还需要满足两个要求: 每个组至少包含一个对象 每个对象...
分类:编程语言   时间:2014-11-13 14:49:34    阅读次数:144
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!