码迷,mamicode.com
首页 >  
搜索关键字:聚类    ( 1791个结果
ML: 聚类算法R包 - 密度聚类
密度聚类 fpc::dbscan fpc::dbscan DBSCAN核心思想:如果一个点,在距它Eps的范围内有不少于MinPts个点,则该点就是核心点。核心和它Eps范围内的邻居形成一个簇。在一个簇内如果出现多个点都是核心点,则以这些核心点为中心的簇要合并。其中要注意参数eps的设置,如果eps ...
分类:编程语言   时间:2017-08-12 10:21:04    阅读次数:282
推荐系统学习07-Waffles
介绍 Waffles 英文原意是蜂蜜甜饼,在这里却指代一个很强大的机器学习的开源工具包。Waffles里包括的算法特别多。涉及机器学习的方方面面,推荐系统位于当中的Waffles_recommend tool,大概仅仅占整个Waffles的1/10的内容,其他还有分类、聚类、採样、降维、数据可视化、 ...
分类:其他好文   时间:2017-08-11 23:09:16    阅读次数:199
kmeans与kmeans++的python实现
一.kmeans聚类: 基本方法流程 1.首先随机初始化k个中心点 2.将每个实例分配到与其最近的中心点,开成k个类 3.更新中心点,计算每个类的平均中心点 4.直到中心点不再变化或变化不大或达到迭代次数 优缺点:该方法简单,执行速度较快。但其对于离群点处理不是很好,这是可以去除离群点。kmeans ...
分类:编程语言   时间:2017-08-11 18:30:12    阅读次数:285
python实现一个层次聚类方法
层次聚类(Hierarchical Clustering) 一.概念 层次聚类不需要指定聚类的数目,首先它是将数据中的每个实例看作一个类,然后将最相似的两个类合并,该过程迭代计算只到剩下一个类为止,类由两个子类构成,每个子类又由更小的两个子类构成。如下图所示: 二.合并方法 在聚类中每次迭代都将两个 ...
分类:编程语言   时间:2017-08-11 14:39:30    阅读次数:344
【基础知识一】绪论
一、基本术语 一个示例=一个样本 属性=特征 属性值-属性空间 一个特征向量,即一个示例 训练集vs验证集vs测试集 假设:模型对应了关于数据的某种潜在规律 学习的任务:分类、回归、聚类 泛化能力:模型适用于新样本的能力 独立同分布:假设全体样本服从一个未知的分布,每个样本都是独立地从这个分布上采样 ...
分类:其他好文   时间:2017-08-10 01:32:52    阅读次数:174
ML: 聚类算法R包-K中心点聚类
K-medodis与K-means比较相似,但是K-medoids和K-means是有区别的,不一样的地方在于中心点的选取,在K-means中,我们将中心点取为当前cluster中所有数据点的平均值,在 K-medoids算法中,我们将从当前cluster 中选取这样一个点——它到其他所有(当前cl ...
分类:编程语言   时间:2017-08-10 01:19:28    阅读次数:269
【数据挖掘】聚类之k-means(转载)
【数据挖掘】聚类之k-means 1.算法简述 分类是指分类器(classifier)根据已标注类别的训练集,通过训练可以对未知类别的样本进行分类。分类被称为监督学习(supervised learning)。如果训练集的样本没有标注类别,那么就需要用到聚类。聚类是把相似的样本聚成一类,这种相似性通 ...
分类:其他好文   时间:2017-08-09 17:28:41    阅读次数:180
贝叶斯来理解高斯混合模型GMM
最近学习基础算法《统计学习方法》,看到利用EM算法估计高斯混合模型(GMM)的时候,发现利用贝叶斯的来理解高斯混合模型的应用其实非常合适。 首先,假设我们对于贝叶斯比较熟悉,对高斯分布也熟悉。本文将GMM用于聚类来举例。 除了简单的高斯分布,理论上通过组合多个不同的高斯分布可以构成任意复杂的分布函数 ...
分类:其他好文   时间:2017-08-09 16:49:39    阅读次数:221
监督学习、 非监督学习、 半监督学习
在机器学习(Machine learning)领域,主要有三类不同的学习方法: 监督学习(Supervised learning)、 非监督学习(Unsupervised learning)、 半监督学习(Semi-supervised learning), 监督学习:通过已有的一部分输入数据与输出 ...
分类:其他好文   时间:2017-08-07 22:08:38    阅读次数:241
hadoop大数据分析与挖掘实战(读书笔记1)
第一章节是从一个餐厅的角度出发,引出来许许多多的相关概念。 第一个概念就是什么是数据挖掘,这个简单,望文生义就好了。它的名字本身就诠释了它的内涵。 基本任务还是得记一下: 1分类与预测。(有点像量化,股票交易) 2聚类分析() 3关联规则() 4时序模式() 5偏差检测() 关于定义挖掘目标,就是什 ...
分类:其他好文   时间:2017-08-07 13:37:11    阅读次数:122
1791条   上一页 1 ... 83 84 85 86 87 ... 180 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!