KNN是数据挖掘中一种简单算法常用来分类,此次用来聚类实现对4种花的简单识别。 环境:python2.7+opencv3.0+windows10 原理:在使用KNN函数提取出4种花特征点以后,对需要辨认的图片提取体征点,与图库中4类花进行比较,匹配点最多的一类即视为同类。 代码: 读入图像数据: 获 ...
分类:
编程语言 时间:
2018-04-18 10:29:53
阅读次数:
411
下载地址:网盘下载 内容简介 · · · · · · 本书是一本机器学习入门教程,包含了数学和统计学的核心技术,用于帮助理解一些常用的机器学习算法。书中展示的算法涵盖了机器学习的各个重要领域:分类、聚类和投影。本书对一小部分算法进行了详细描述和推导,而不是简单地将大量算法罗列出来。本书通过大量的MA ...
分类:
其他好文 时间:
2018-04-15 14:49:02
阅读次数:
171
faiss 个人理解: https://github.com/facebookresearch/faiss 上把代码clone下来,make编译 我们将CNN中经过若干个卷积/激励/池化层后得到的激活映射(向量形式)存储到硬盘上, Faiss是一个高效的相似性搜索和密集向量聚类的库。它包含了搜索任意 ...
分类:
其他好文 时间:
2018-04-09 11:18:15
阅读次数:
407
faiss安装 faiss是facebook开发的有CPU版本和GPU版本的求密集向量相似性和进行密集向量聚类的库。 faiss用c++编写,安装faiss需要在github上下载其c++源码并用make编译安装 faiss仅有的两个依赖包:blas和lapack CPU 方面,Facebook 大 ...
分类:
其他好文 时间:
2018-04-09 11:10:49
阅读次数:
2491
吴恩达 MachineLearning Week8 知识点概述 1. K - means 算法 K - means 算法用于解决聚类问题,属于无监督学习。可以对没有标记的数据进行处理,将其分成 K 类。其步骤如下: 2. PLA( Principal Component Analysis ) 用于将 ...
分类:
系统相关 时间:
2018-04-08 21:15:36
阅读次数:
231
一、前述 谱聚类(spectral clustering)是一种基于图论的聚类方法,主要思想是把所有的数据看做空间中的点,这些点之间可以用边连接起来。距离较远(或者相似度较低)的两个点之间的边权重值较低,而距离较近(或者相似度较高)的两个点之间的边权重值较高,通过对所有数据点组成的图进行切图,让切图 ...
分类:
其他好文 时间:
2018-04-06 20:21:57
阅读次数:
404
利用隐含变量最佳类别(EM算法思想)实现将数据更加准确地聚类 ...
分类:
编程语言 时间:
2018-04-06 20:21:26
阅读次数:
191
一、前述 聚类就是对大量未知标注的数据集,按数据的内在相似性将数据集划分为多个类别,使类别内的数据相似度较大而类别间的数据相似度较小.数据聚类算法可以分为结构性或者分散性,许多聚类算法在执行之前,需要指定从输入数据集中产生的分类个数。1.分散式聚类算法,是一次性确定要产生的类别,这种算法也已应用于从 ...
分类:
其他好文 时间:
2018-04-06 18:45:40
阅读次数:
221
K-means算法是硬聚类算法,是典型的基于原型的目标函数聚类方法的代表,它是数据点到原型的某种距离作为优化的目标函数,利用函数求极值的方法得到迭代运算的调整规则。K-means算法以欧式距离作为相似度测度,它是求对应某一初始聚类中心向量V最优分类,使得评价指标J最小。算法采用误差平方和准则函数作为 ...
分类:
其他好文 时间:
2018-04-05 21:01:40
阅读次数:
147
一、理论 聚类就是把东西聚在一起,那一定有一定的规则,相似等,后面会给出。聚类与分类的不同就是,聚类所要求的划分的类是未知的。聚类是这么定义的:将数据分类到不同的类或者簇这样的一个过程,所以同一个簇中的对象有很大的相似性,而不同簇之间的对象很大的相异性。按照个体或样品(individuals, ob ...
分类:
其他好文 时间:
2018-04-05 20:06:48
阅读次数:
319