0. 背景 评估(或者说验证)聚类结果就如同聚类本身一样困难。通常的方法有 内部评估 和 外部评估 这两种: 内部评估的方法:通过一个单一的量化得分来评估算法好坏;该类型的方法 外部评估的方法:通过将聚类结果与已经有“ground truth”分类进行对比。要么通过人类进行手动评估,要么通过一些指标 ...
分类:
其他好文 时间:
2018-03-16 18:39:41
阅读次数:
191
Python在机器学习方面一个非常强力的模块---scikit-learn模块,它作为数据挖掘和数据分析方面的一个简单而有效的工具,主要包括6大功能:分类(Classification),回归(Regression),聚类(Clustering),降维(Dimensionality Reductio ...
分类:
编程语言 时间:
2018-02-20 14:44:16
阅读次数:
258
Clustering Unsupervised learning introduction 什么是非监督学习呢? 在一个典型的监督学习中,我们有一个有标签的训练集,我们的目标是找到能够区分正样本和负样本的决策边界,在这里的监督学习中,我们有一系列标签,我们需要据此拟合一个假设函数。 与此不同的是,在 ...
分类:
其他好文 时间:
2018-02-09 23:57:50
阅读次数:
380
ng机器学习视频笔记(十一) ——K-均值算法理论 (转载请附上本文链接——linhxx) 一、概述 K均值(K-Means)算法,是一种无监督学习(Unsupervised learning)算法,其核心是聚类(Clustering),即把一组输入,通过K均值算法进行分类,输出分类结果。 由于K均 ...
分类:
编程语言 时间:
2018-02-04 12:49:50
阅读次数:
172
十三、聚类(Clustering) 13.1 无监督学习:简介 13.2 K 均值算法 13.3 优化目标 13.4 随机初始化 13.5 选择聚类数 十四、降维(Dimensionality Reduction) 14.1 动机一:数据压缩 14.2 动机二:数据可视化 14.3 主成分分析问题 ...
分类:
其他好文 时间:
2018-01-17 01:13:49
阅读次数:
553
K-均值聚类 k-均值(k-means Clustering)算法是著名的划分聚类算法。由于他的简洁和效率使得它成为所有聚类算法中最为广泛使用的。 给定一个数据点集合和需要的聚类数目K(K是有用户指定的),K-均值算法根据某个距离函数反复的把数据分入K个聚类中。 聚类属于无监督学习,以往的回归、朴素 ...
分类:
其他好文 时间:
2018-01-14 17:39:36
阅读次数:
179
昨天: (1)找到了一个Spyder,运行出了网上的一段代码。 (2)收到了老师的数据,目前的方向是CNN和hierarchical clustering(层次聚类) (3)在网上的视频看到了代码,应该看看并尝试运行。 今天: (1)运行:左边 Tensorflow(现已支持Windows) (2) ...
分类:
其他好文 时间:
2018-01-06 00:33:52
阅读次数:
172
Windows?Server?Failover?Clustering是微软重要的Windows?Server功能,它为微软众多企业级平台提供底层高可用机制,掌握WSFC的概念原理,功能使用,故障排错将对管理员运维有很大帮助,本系列文章将从WSFC的概念介绍,功能使用,故障排错,性能优化,WSFC?2016新功能解析等多个层面来为大家介绍WSFC,一
分类:
其他好文 时间:
2017-12-24 21:34:39
阅读次数:
176
kmeans Scala程序 import org.apache.spark.{SparkConf, SparkContext} import org.apache.spark.mllib.clustering.{KMeans, KMeansModel} import org.apache.spar ...
分类:
编程语言 时间:
2017-12-22 00:36:40
阅读次数:
231
机器学习week8 ex7 review 这周学习K-means,并将其运用于图片压缩。 1 K-means clustering 先从二维的点开始,使用K-means进行分类。 1.1 Implement K-means K-means步骤如上,在每次循环中,先对所有点更新分类,再更新每一类的中心 ...
分类:
其他好文 时间:
2017-11-23 08:21:34
阅读次数:
215