对应海明距离的LSH称为位采样算法(bit sampling),该算法是比较得到的哈希值的海明距离,但是一般距离都是用欧式距离进行度量的,将欧式距离映射到海明空间再比较其的海明距离比较麻烦。于是,研究者提出了基于p-稳定分布的位置敏感哈希算法,可以直接处理欧式距离,并解决(R,c)-近邻问题。...
分类:
其他好文 时间:
2014-07-30 01:07:52
阅读次数:
985
最近邻问题(nearest neighbor problem)可以定义如下:给定n个对象的集合并建立一个数据结构,当给定任意的要查询对象时,该数据结构返回针对查询对象的最相似的数据集对象。LSH的基本思想是利用多个哈希函数把高维空间中的向量映射到低维空间,利用低维空间的编码来表示高维向量。通过对向量对象进行多次哈希映射,高维向量按照其分布以及自身的特性落入不同哈希表的不同桶中。在理想情况下可以认为在高维空间中位置比较接近的向量对象有很大的概率最终落入同一个桶中,而距离比较远的对象则以很大的概率落入不同的桶中...
分类:
其他好文 时间:
2014-07-29 14:25:28
阅读次数:
219
本文主要讨论为什么当前流行的检索方法仍然是BOW。...
分类:
其他好文 时间:
2014-06-08 10:34:48
阅读次数:
639
一种基于XML的报表开发工具,它支持从设计报表,调用API打印、预览,能支持分布式报表、方便报表的存储、转发。在报表中能嵌入VBScript,能方便地访问VB,VC的变量,能访问COM组件、ADO等遵循ActiveX标准的控件。
包括报表可视化开发界面、报表语法解释器,基于COM的组件。是分布式报表的完美解决方案
语法如下:
dim rs,con,sql,lsh
...
分类:
Web程序 时间:
2014-05-13 08:56:24
阅读次数:
388