1.Locality Sensitive Hashing(Shingling+MinHash) (LSH, 局部敏感哈希) 2. Learning to Hash 1.Introduction 很多的网页挖掘问题都可以表述为寻找相似集合: 1. 论文查重; 2. 推荐系统; 2.Finding Si ...
分类:
其他好文 时间:
2019-03-23 13:11:55
阅读次数:
143
①HashMap的工作原理 HashMap基于hashing原理,我们通过put()和get()方法储存和获取对象。当我们将键值对传递给put()方法时,它调用键对象的hashCode()方法来计算hashcode,让后找到bucket位置来储存值对象。当获取对象时,通过键对象的equals()方法 ...
分类:
其他好文 时间:
2019-03-04 11:13:35
阅读次数:
136
Open domain QA Overview The whole system is consisted with Document Retriever and Document Reader. The Document Retriever returns top five Wikipedia a ...
分类:
其他好文 时间:
2019-02-24 10:27:14
阅读次数:
192
https://autofac.readthedocs.io/en/latest/glossary.html The goal of this page is to help keep documentation, discussions, and APIs consistent. Componen ...
分类:
其他好文 时间:
2019-02-23 14:48:39
阅读次数:
119
MySQL 事务介绍 标签(空格分隔): Mysql 事务 [TOC] MySQL事务 ACID 1. 原子性(Atomcity) 一个事务的最小单元,要么全部成功要么全部失败,执行的过程中是不能被打断或者执行其他操作的。 2. 一致性(Consistent) 事务开始前和结束后,数据库的完整性约束 ...
分类:
数据库 时间:
2019-02-01 18:06:30
阅读次数:
171
Rendezvous Hashing Rendezvous or highest random weight (HRW) hashing is an algorithm that allows clients to achieve distributed agreement on a set of ...
分类:
其他好文 时间:
2019-01-24 20:06:48
阅读次数:
171
HashMap实现原理及源码分析 哈希表(hash table)也叫散列表,是一种非常重要的数据结构,应用场景及其丰富,许多缓存技术(比如memcached)的核心其实就是在内存中维护一张大的哈希表,而HashMap的实现原理也常常出现在各类的面试题中,重要性可见一斑。本文会对java集合框架中的对 ...
分类:
其他好文 时间:
2019-01-24 01:11:52
阅读次数:
169
Data Structure and Algorithm Analysis in C++ 5.4.3 Double Hashing In the beginning of chapter 5.4, the formula hi(x) = (hash(x) + f(i)) is mentioned a ...
分类:
其他好文 时间:
2019-01-05 17:18:06
阅读次数:
177
①HashMap的工作原理 HashMap基于hashing原理,我们通过put()和get()方法储存和获取对象。当我们将键值对传递给put()方法时,它调用键对象的hashCode()方法来计算hashcode,让后找到bucket位置来储存值对象。当获取对象时,通过键对象的equals()方法 ...
分类:
其他好文 时间:
2019-01-02 17:34:35
阅读次数:
188
转自局部敏感哈希(Locality-Sensitive Hashing, LSH) 一、局部敏感哈希LSH 在很多应用领域中,我们面对和需要处理的数据往往是海量并且具有很高的维度,怎样快速地从海量的高维数据集合中找到与某个数据最相似(距离最近)的一个数据或多个数据成为了一个难点和问题。如果是低维的小 ...
分类:
其他好文 时间:
2019-01-02 17:33:43
阅读次数:
209