hashtable

时间：2015-11-18 23:03:55 阅读：287 评论：0 收藏：0 [点我收藏+]

标签：

HashTable是一种能提供快速插入和查询的数据结构，无论其包含有多少Item，查询和插入操作的平均时间总是接近O(1)。
hash function 的作用就是将这些范围很大的数（domain of keys ）转换成我们需要的序号（domain of location）。
.net framework采用Division Methed作为其散列算法，使用取模（modulo）操作将Hash code值域转换到合适的范围。即：
arrayIndex = hashcode % arraySize;
其中arrayIndex代表单词在数组中的位置，ArraySize代表数组长度，

Collisions
我们希望每一个Hash Code都唯一对应一个Index，然而这个算法并不能保证这一点。比如你想将"melioration"插入到数组，你将这个单词通过上述过程转换成index，然而你发现那个位置已经被"demystify"所占据，这种情况叫做Collisions（冲突）。
.net framework使用open address 的方式解决冲突，例如当进行插入操作时，根据键值生成的index已经被别的item占据时，它将自动搜索index+incr位置，直到找到一个空的位置。其中的incr由以下算法产生。
incr = (uint)(1 + (((hashcode >> 5) + 1) % ((uint)itemCount - 1)));
.net framework生成incr的这种算法，其结果与当前冲突位置无关，避免了好多问题。事实上它根据键值的hash code 进行了另一次散列，即所谓的Double Hash.
Expand

由于HashTable基于数组的，所以它的容量需要提前指定，并且最好在运行过程中不要改变。数组的大小是不能在运行时改变的，所以当HashTable太满时，就需要声明一个新的大数组。
我们记得Hash Function 根据数组的长度计算键值的序号的，所以不可以将旧数组的数据直接复制到新数组，必须对针对每一个键值重新计算其位置，非常的低效。
.net framework实现中HashTable最小的容量为11,当HashTable过满时，会新建立一个容量为 int prime = HashHelpers.GetPrime(this.buckets.Length * 2);这里有取最大素数的的数组，然后将旧数组的值复制到新数组对应的位置(复制的过程中，会对每一个键值重新计算位置的)。
”HashTable用开放定址法解决冲突，用双散列法进行探测。装填因子过高之后使用再散列法扩充“
Hashtable 中的实际数据都存储在一个内部 Array 中 (当然和普通数组一样, 有固定容量, 上下标, 以数字索引存取), 当用户希望取得 Hashtable[K] 值的时候, Hashtable 进行如下处理: [1] 为了保证 f(K) 的取值范围在 0 <= f(K) < Array.Length, 函数 f 的关键步骤是取模运算, 算得实际数据存储位置为 f(K) = HashOf(K) % Array.Length, 至于这个 HashOf(K) 怎么算出来的, 简单举例来说她可以取关键字的 ASCII 码根据一定规则运算得到. [2] 如果发生多个 K 值的哈希值重复, 即 f(K1) = f(K2), 而 f(K1) 位置已经有数据占用了, Hashtable 采用的是 "开放定址法" 处理冲突, 具体行为是把 HashOf(K2) % Array.Length 改为 (HashOf(K2) + d(K2)) % Array.Length , 得出另外一个位置来存储关键字 K2 所对应的数据, d 是一个增量函数. 如果仍然冲突, 则再次进行增量, 依此循环直到找到一个 Array 中的空位为止. 将来查找 K2 的时候先搜索 HashOf(K2) 一档, 发现不是 K2, 那么增量 d(K2) 继续搜索, 直到找到为止. 连续冲突次数越多, 搜索次数也越多, 效率越低.

hashtable

标签：

原文地址：http://www.cnblogs.com/tuanzi/p/4976052.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行