本文所有涉及到的数据挖掘代码的都放在了我的github上了:https://github.com/linyiqun/DataMiningAlgorithm
大概花了将近2个月的时间,自己把18大数据挖掘的经典算法进行了学习并且进行了代码实现,涉及到了决策分类,聚类,链接挖掘,关联挖掘,模式挖掘等等方面。也算是对数据挖掘领域的小小入门了吧。下面就做个小小的总结,后面都是我自己相应算法的博文链接,希...
分类:
编程语言 时间:
2015-02-27 12:02:45
阅读次数:
143
看了些论文,小结一下,分享给大家!聚类算法主要可以分为以下几类:1)基于划分的方法划分方法的主要思想是:给定要构建的划分数目k,在数据库中随机选择k个对象,每个对象代表一个类的平均值或中心,根据剩余的对象到类中心的距离将其划分到最近的类,然后重新计算每个类的中心,不断重复这个过程,直到所有的对象都不...
分类:
编程语言 时间:
2015-02-27 09:53:34
阅读次数:
171
KMeans算法的基本思想是初始随机给定K个簇中心,按照最邻近原则把待分类样本点分到各个簇。然后按平均法重新计算各个簇的质心,从而确定新的簇心。一直迭代,直到簇心的移动距离小于某个给定的值。K-Means聚类算法主要分为三个步骤:(1)第一步是为待聚类的点寻找聚类中心(2)第二步是计算每个点到聚类中...
分类:
其他好文 时间:
2015-02-26 22:45:26
阅读次数:
250
K-means算法#include#include#include#includeusing namespace std;#define K 4 /*数据维度*/#define C 8 /*聚类数*/#define N 150 /*样本数*/#define IterMax 5/*最大迭代数*/#de...
分类:
编程语言 时间:
2015-02-26 14:46:29
阅读次数:
134
市场细分在战略营销中占据着极其重要的地位。营销大师Kotler等(1999)把市场细分定义为“将市场划分为有着显著需求、特征或行为差异的不同群体的消费者,每一群体的消费者对产品或营销组合有着同质的需求”。Dibb等(2001)认为,市场细分就是将具有异质特征的消费者进行聚类的过程,细分后的每一类消....
分类:
其他好文 时间:
2015-02-24 01:52:24
阅读次数:
314
这是一个比较新的聚类方法(文章中没看见作者对其取名,在这里我姑且称该方法为local density clustering,LDC),在聚类这个古老的主题上似乎最近一些年的突破不大,这篇文章算是很好的了,方法让人很有启发(醍醐灌顶),并且是发表在Science上,受到的关注自然非常大。本文的核心亮点:1是用比较新颖的方法来确定聚类中心,2是采用距离的local density来进行聚类的划分。...
分类:
其他好文 时间:
2015-02-22 21:56:28
阅读次数:
179
从决策树学习谈到贝叶斯分类算法、EM、HMM引言 近期在面试中,除了基础 & 算法 & 项目之外,经常被问到或被要求介绍和描写叙述下自己所知道的几种分类或聚类算法(当然,这全然不代表你将来的面试中会遇到此类问题,仅仅是由于我的简历上写了句:熟悉常见的聚类 & 分类算法而已),而我向来恨对...
分类:
编程语言 时间:
2015-02-20 18:33:53
阅读次数:
780
在 聚类算法K-Means, K-Medoids, GMM, Spectral clustering,Ncut一文中我们给出了GMM算法的基本模型与似然函数,在EM算法原理中对EM算法的实现与收敛性证明进行了具体说明。本文主要针对怎样用EM算法在混合高斯模型下进行聚类进行代码上的分析说明。1. GM...
分类:
编程语言 时间:
2015-02-09 21:34:57
阅读次数:
231
K-Means 是一种基于距离的排他的聚类划分方法。K-Means 基本原理:给定划分数量 k。创建一个初始划分,从数据集中随机地选择 k 个对象,每个对象初始地代表了一个簇中心(Cluster Centroid)。对于其他对象,计算其与各个簇中心的距离,将它们划入距离最近的簇。采用迭代的重定位技术...
分类:
编程语言 时间:
2015-02-06 23:05:35
阅读次数:
540
(一)深入浅出理解索引结构 实际上,您可以把索引理解为一种特殊的目录。微软的SQL SERVER提供了两种索引:聚集索引(clustered index,也称聚类索引、簇集索引)和非聚集索引(nonclustered index,也称非聚类索引、非簇集索引)。下面,我们举例来说明一下聚集索引和非聚....
分类:
数据库 时间:
2015-02-06 14:29:41
阅读次数:
187