本文记录本人曾经阅读过的一些文章,其中主要包括在编程、学习过程中搜集的一些琐碎知识点等。 由于文章过多,此处只记录文章的地址,可点击查看原网页。 由于内容很多,放在一篇文章中显得太长,故每个月一篇。 2016-11-24 聚类 2.3. Clustering — scikit-learn 0.18.... ...
分类:
其他好文 时间:
2016-12-31 07:20:31
阅读次数:
261
在谱聚类(spectral clustering)原理总结中,我们对谱聚类的原理做了总结。这里我们就对scikit-learn中谱聚类的使用做一个总结。 1. scikit-learn谱聚类概述 在scikit-learn的类库中,sklearn.cluster.SpectralClustering ...
分类:
其他好文 时间:
2016-12-30 18:58:20
阅读次数:
765
聚类是一种无监督的学习,它将相似的对象归到同一簇中。它有点像全自动分类。聚类方法几乎可以应用到所有对象,簇内的对象越相似,聚类的效果越好。 K-均值(K-means)聚类算法,之所以称之为K-均值是因为它可以发现k个不同的簇,且每个簇的中心采用簇中所含值的均值计算而成。 簇识别(cluster id ...
分类:
编程语言 时间:
2016-12-26 11:56:13
阅读次数:
215
一、 什么是聚类 聚类简单的说就是要把一个文档集合根据文档的相似性把文档分成若干类,但是究竟分成多少类,这个要取决于文档集合里文档自身的性质。下面这个图就是一个简单的例子,我们可以把不同的文档聚合为3类。另外聚类是典型的无指导学习,所谓无指导学习是指不需要有人干预,无须人为文档进行标注。 二、聚类算 ...
分类:
编程语言 时间:
2016-12-24 23:04:10
阅读次数:
1222
在DBSCAN密度聚类算法中,我们对DBSCAN聚类算法的原理做了总结,本文就对如何用scikit-learn来学习DBSCAN聚类做一个总结,重点讲述参数的意义和需要调参的参数。 1. scikit-learn中的DBSCAN类 在scikit-learn中,DBSCAN算法类为sklearn.c ...
分类:
数据库 时间:
2016-12-24 20:43:23
阅读次数:
1103
两步聚类算法是在SPSS Modeler中使用的一种聚类算法,是BIRCH层次聚类算法的改进版本。可以应用于混合属性数据集的聚类,同时加入了自动确定最佳簇数量的机制,使得方法更加实用。本文在学习文献和“IBM SPSS Modeler 15 Algorithms Guide”的基础上,融入了自己的理... ...
分类:
编程语言 时间:
2016-12-24 01:26:21
阅读次数:
288
http://www.jianshu.com/p/ab697790090f 特征选择与特征学习 在机器学习的具体实践任务中,选择一组具有代表性的特征用于构建模型是非常重要的问题。特征选择通常选择与类别相关性强、且特征彼此间相关性弱的特征子集,具体特征选择算法通过定义合适的子集评价函数来体现。在现实世 ...
分类:
其他好文 时间:
2016-12-22 18:47:14
阅读次数:
309
- [R与画面集成(聚类) 1.利用?内置数据集光圈; 2.通过Rserve包连接画面,服务器:本地主机,默认端口6311; 3.加载数据集光圈; 4.编辑字段:集群 5.该代码在?中的效果; 6.字段:Cluster_Result 7.最终效果图 转载:http://www.voidcn.com/ ...
分类:
其他好文 时间:
2016-12-21 02:24:04
阅读次数:
135
《机器学习系统设计》是一本不错的机器学习实战入门的书籍。第一章介绍了用于机器学习的Python相关工具,接下来分别用实战型例子讲解聚类、分类、回归、模式识别、降维等机器学习的主要的几种方法。 机器学习就是教机器自己来完成任务,机器学习的目标就是通过若干示例让机器学会完成任务。 像其他工程一样,设计一 ...
分类:
其他好文 时间:
2016-12-21 02:09:37
阅读次数:
138
K-means(K均值)是基于数据划分的无监督聚类算法。 一、基本原理 聚类算法可以理解为无监督的分类方法,即样本集预先不知所属类别或标签,需要根据样本之间的距离或相似程度自动进行分类。聚类算法可以分为基于划分的方法、基于联通性的方法、基于概率分布模型的方法等,K-means属于基于划分的聚类方法。 ...
分类:
编程语言 时间:
2016-12-15 17:52:05
阅读次数:
242