移步bdata-cap.com Faiss 快速入门(1) Faiss 更快的索引(2) Faiss低内存占用(3) Faiss 构建: clustering, PCA, quantization(4) 如何选择Faiss索引(5) ...
分类:
其他好文 时间:
2020-04-02 22:22:03
阅读次数:
195
faiss 个人理解: https://github.com/facebookresearch/faiss 上把代码clone下来,make编译 我们将CNN中经过若干个卷积/激励/池化层后得到的激活映射(向量形式)存储到硬盘上, Faiss是一个高效的相似性搜索和密集向量聚类的库。它包含了搜索任意 ...
分类:
其他好文 时间:
2018-04-09 11:18:15
阅读次数:
407
https://www.leiphone.com/news/201703/84gDbSOgJcxiC3DW.html 本月初雷锋网报道,Facebook 开源了 AI 相似性搜索工具 Faiss。而在一个月之后的今天,Facebook 发布了对 Faiss 的官方原理介绍。 它是一个能使开发者快速搜 ...
分类:
其他好文 时间:
2018-03-21 11:40:24
阅读次数:
211
机器学习起源于神经网络,而深度学习是机器学习的一个快速发展的子领域。最近的一些算法的进步和GPU并行计算的使用,使得基于深度学习的算法可以在围棋和其他的一些实际应用里取得很好的成绩。 时尚产业是深度学习的目标领域之一。闪购网站Gilt就一直在使用深度学习来进行产品推荐和服装的属性分类。裙子样式是通过 ...
分类:
其他好文 时间:
2017-02-23 10:59:35
阅读次数:
234
感谢大神们的无私奉献精神........因此笔者要坚持开源,专注开源,开源就像在HPU的考试中不像其他人作弊一样,长远来看,会有巨大收获。一.背景介绍1.1 相似性搜索简介 高维相似性搜索在音频、图形和传感器数据等特征丰富的数据的基于内容的检索中日益重要,一般来说应用在KNN和ANN。一个针对...
分类:
其他好文 时间:
2015-07-07 19:02:56
阅读次数:
188
引言
上一小节中,我们初步介绍了Multi-Probe
LSH算法的大致思路,为了不显得博客文章太冗杂,所以将这个话题分成几篇文章来写。
在该小节文章中,我将具体介绍一下生成微扰向量序列(a sequence of perturbation vectors)的方法及相关分析。
步进式探测(Step-Wise Probing)
n-step微扰向量Δ有n个非零坐标,根据位置敏...
分类:
编程语言 时间:
2015-03-08 23:06:43
阅读次数:
1453
摘要
针对高维数据的相似性索引非常适于构建内容相关的检索系统,尤其对于音频、图像、视频等内容丰富的数据。近年来,位置敏感哈希及其变种算法以近似相似性搜索的索引技术被提出,这些方法的一个显著缺点是需要很多的哈希表来保证良好的搜索效果。该文章提出了一个新的索引策略来克服上述缺点,称作多探头LSH。
多探头LSH建立在LSH技术基础上,它可以智能地探测哈希表中可能包含查询结果的多个桶(bucke...
分类:
其他好文 时间:
2015-03-05 12:57:26
阅读次数:
217
E2LSH的核心代码可以分为3部分:
LocalitySensitiveHashing.cpp——主要包含基于LSH的RNN(R-near neighbor)数据结构。其主要功能是根据参数构建数据结构进行查询数据对象的功能;
BucketHashing.cpp——主要包含对于哈希桶的普通哈希表。其主要功能是构建哈希表,添加哈希桶到表中和查询哈希桶;
SelfTuning.cpp——包含计算RNN数据结构最佳参数的函数。...
分类:
其他好文 时间:
2014-08-01 23:13:02
阅读次数:
404
对应海明距离的LSH称为位采样算法(bit sampling),该算法是比较得到的哈希值的海明距离,但是一般距离都是用欧式距离进行度量的,将欧式距离映射到海明空间再比较其的海明距离比较麻烦。于是,研究者提出了基于p-稳定分布的位置敏感哈希算法,可以直接处理欧式距离,并解决(R,c)-近邻问题。...
分类:
其他好文 时间:
2014-07-30 01:07:52
阅读次数:
985
最近邻问题(nearest neighbor problem)可以定义如下:给定n个对象的集合并建立一个数据结构,当给定任意的要查询对象时,该数据结构返回针对查询对象的最相似的数据集对象。LSH的基本思想是利用多个哈希函数把高维空间中的向量映射到低维空间,利用低维空间的编码来表示高维向量。通过对向量对象进行多次哈希映射,高维向量按照其分布以及自身的特性落入不同哈希表的不同桶中。在理想情况下可以认为在高维空间中位置比较接近的向量对象有很大的概率最终落入同一个桶中,而距离比较远的对象则以很大的概率落入不同的桶中...
分类:
其他好文 时间:
2014-07-29 14:25:28
阅读次数:
219