simhash算法 方法介绍 背景 如果某一天,面试官问你如何设计一个比较两篇文章相似度的算法?可能你会回答几个比较传统点的思路: 一种方案是先将两篇文章分别进行分词,得到一系列特征向量,然后计算特征向量之间的距离(可以计算它们之间的欧氏距离、海明距离或者夹角余弦等等),从而通过距离的大小来判断两篇 ...
分类:
编程语言 时间:
2018-02-02 11:40:12
阅读次数:
204
人脸识别 人脸识别技术是基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机或摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行脸部的一系列相关技术,通常也叫做人像识别、面部识别 人脸识别流程人脸识别技术流程主要包括四个组成部分,分别为:人脸图像采集及检测 ...
分类:
其他好文 时间:
2018-01-24 19:52:20
阅读次数:
224
K-近邻算法(K-NN) 邻近算法,或者说K最近邻(kNN,k-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一。所谓K最近邻,就是k个最近的邻居的意思,说的是每个样本都可以用它最接近的k个邻居来代表。 kNN算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的 ...
分类:
编程语言 时间:
2018-01-06 18:03:18
阅读次数:
415
协方差 与 相关系数 source 比如,几米的漫画《向左走,向右走》,讲述了一对都市男女,比邻而居:却总是擦肩而过: 用句文艺的话来说就是,“距离那么近,相隔那么远”。 这里面就包含了两个数学中的距离: ? “距离那么近”:欧式距离,也就是两点之间的直线距离 ? “相隔那么远”:余弦距离,也就是本 ...
分类:
其他好文 时间:
2018-01-02 23:23:29
阅读次数:
200
1.概述1.1 原理:(测量不同的特征值之间的距离进行分类) 存在样本数据集合,即训练样本集,并且样本集中的每个数据都存在多个特征和标签,即我们知道样本数据和其所属分类,在我们输入没有标签的新数据后,将新数据的每个特征和样本集中的数据对应的特征进行比较,然后根据相应算法(本节选择的是欧氏距离)提取与... ...
分类:
编程语言 时间:
2017-12-21 21:48:52
阅读次数:
220
1.k均值聚类是聚类算法,不是分类算法 k均值聚类就是利用欧氏距离的度量将距离相近的样本分为k类 2.算法思想 a. 假设有m个样本,{[x1,y1],[x2,y2],,,,[xm,ym]},首先随机选择k个样本作为聚类的质心(要分成k类) b. 然后对于每个样本,计算它到每个质心的距离,将它归类于 ...
分类:
其他好文 时间:
2017-12-19 01:10:57
阅读次数:
99
先收藏,用到了在看 1. 欧氏距离(Euclidean Distance) 欧氏距离是最易于理解的一种距离计算方法,源自欧氏空间中两点间的距离公式。 (1)二维平面上两点a(x1,y1)与b(x2,y2)间的欧氏距离: (2)三维空间两点a(x1,y1,z1)与b(x2,y2,z2)间的欧氏距离: ...
分类:
编程语言 时间:
2017-11-20 21:44:29
阅读次数:
227
学习《机器学习实战》第2章 参考博客:http://blog.csdn.net/c406495762/article/details/75172850#三-k-近邻算法实战之sklearn手写数字识别 K近邻法(k-nearest neighbor,K-NN)采用测量不同特征值之间的距离方法进行分类 ...
分类:
其他好文 时间:
2017-11-14 21:19:35
阅读次数:
242
欧几里得距离-欧氏距离,也就是我们熟知的距离,可扩展至m维 2维:d=sqrt((x1-x2)2+(y1-y2)2) 3维:d=sqrt((x1-x2)2+(y1-y2)2+(z1-z2)2) m维:d=sqrt(∑(xi,1-xi,2)2) 曼哈顿距离-出租车距离,在一个横竖分布的网格上,两点之间 ...
分类:
其他好文 时间:
2017-10-25 21:39:20
阅读次数:
179
题意:有个机器人,他在一条线路上走着,他的显示器上应该显示的是路径的剩余距离,但实际上显示屏显示的是欧氏距离,所以问你在路径上有没有一个点,满足距离突然变大(比前一刻距离大) 题解:求一下任意2条直线的家教关系,当然你也可以计算点是否在相邻两侧的点为直径的园内,本质是一样的 ...
分类:
其他好文 时间:
2017-10-15 19:40:09
阅读次数:
203