码迷,mamicode.com
首页 >  
搜索关键字:聚类    ( 1791个结果
Clustering by density peaks and distance
这次介绍的是Alex和Alessandro于2014年发表在的Science上的一篇关于聚类的文章[13],该文章的基本思想很简单,但是其聚类效果却兼具了谱聚类(Spectral Clustering)[11,14,15]和K-Means的特点,着实激起了我的极大的兴趣,该聚类算法主要是基于两个基本...
分类:其他好文   时间:2014-12-04 21:30:15    阅读次数:281
理解谱聚类
前面介绍过K-means聚类方法,这个方法简单易懂,主要在于如何定义距离计算公式(一般使用欧氏距离),如何选择K值,这两个问题。这次我们介绍谱聚类,它是K-means的升级版。我们计划从这样几个方面介绍谱聚类:K-measn聚类有什么缺点?谱聚类的基本思想,以及谱聚类的算法步骤。...
分类:其他好文   时间:2014-12-04 15:48:14    阅读次数:243
kmeans聚类
k-means:基于划分算法的典型、实现比较简单。特点是只能聚球形、受离群点的影响很大。 采用python实现:用二维矩阵来存点集和质心点、每次循环分两步:计算质心和重新分配点,循环直到最小平方误差SSE收敛为止,或者指定一个最大的迭代次数。 关于画图,我使用的是pylab和Matplotlib,Matplotlib中的很多函数和matlab用法一样,比较方便作图,安装它时花了很长的时间来解决...
分类:其他好文   时间:2014-12-03 15:43:56    阅读次数:230
[论文]A Link-Based Approach to the Cluster Ensemble Problem
论文作者:Natthakan Iam-On, Tossapon Boongoen, Simon Garrett, and Chris Price 下次还是在汇报前先写了论文总结,不然有些点汇报时容易忘了说,以前看的论文看补不补上来吧,有时间再说。前言: 这篇论文是关于聚类集成的,成熟的聚类集成框.....
分类:移动开发   时间:2014-12-02 13:23:01    阅读次数:527
《BI那点儿事》数据挖掘各类算法——准确性验证
原文:《BI那点儿事》数据挖掘各类算法——准确性验证准确性验证示例1:——基于三国志11数据库 数据准备: 挖掘模型:依次为:Naive Bayes 算法、聚类分析算法、决策树算法、神经网络算法、逻辑回归算法、关联算法提升图: 依次排名为: 1. 神经网络算法(92.69% 0.99)2. 逻辑回归...
分类:编程语言   时间:2014-12-02 10:32:29    阅读次数:222
《BI那点儿事》Microsoft 顺序分析和聚类分析算法
原文:《BI那点儿事》Microsoft 顺序分析和聚类分析算法Microsoft 顺序分析和聚类分析算法是由 Microsoft SQL Server Analysis Services 提供的一种顺序分析算法。您可以使用该算法来研究包含可通过下面的路径或“顺序”链接到的事件的数据。该算法通过对相...
分类:编程语言   时间:2014-12-02 10:13:58    阅读次数:201
《BI那点儿事》Microsoft 聚类分析算法——三国人物身份划分
原文:《BI那点儿事》Microsoft 聚类分析算法——三国人物身份划分什么是聚类分析?聚类分析属于探索性的数据分析方法。通常,我们利用聚类分析将看似无序的对象进行分组、归类,以达到更好地理解研究对象的目的。聚类结果要求组内对象相似性较高,组间对象相似性较低。在三国数据分析中,很多问题可以借助聚类...
分类:编程语言   时间:2014-12-02 10:12:47    阅读次数:115
《BI那点儿事》数据挖掘各类算法——准确性验证
准确性验证示例1:——基于三国志11数据库数据准备:挖掘模型:依次为:Naive Bayes 算法、聚类分析算法、决策树算法、神经网络算法、逻辑回归算法、关联算法提升图:依次排名为: 1. 神经网络算法(92.69% 0.99)2. 逻辑回归算法(92.39% 0.99)3. 决策树算法(91.19...
分类:编程语言   时间:2014-12-01 20:43:18    阅读次数:196
MinHash算法
MinHash是用于快速检测两个集合的相似性的方法。改方法由Andrei Broder(1997)发明,并最初用于搜索引擎AltaVista中来检测重复的网页的算法。它同样可以用于推荐系统和大规模文档聚类中。我们先介绍Jaccard相似度量。对于两个集合A与B,Jaccard相似性系数可以定义为:容...
分类:编程语言   时间:2014-11-29 22:50:10    阅读次数:513
Java正则表达式的几个应用实例(匹配网址,匹配美国安全码,匹配日期)
由于最近做的项目需要从英文文本中提取出字符串进行话题的聚类,于是就花了一天的时间来学习Java正则表达式,一下几个小例子是我的一些小练笔,如有不合理之处,还望各位指教!! 1.此例是用来过滤掉英文文本中的网址,并将过滤后的字符串输出 首先需要先贴出来我需要过滤的英文文本,我将这些文本存在一...
分类:编程语言   时间:2014-11-29 17:13:00    阅读次数:199
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!