Java Hashtable 数据结构

int hash = key.hashCode(); int index = (hash & 0x7FFFFFFF) % tab.length; for (Entry<K,V> e = tab[index] ; e != null ; e = e.next) { if ((e.hash == hash) && e.key.equals(key)) { V old = e.value; e.value = value; return old; } }

看到上面这段代码时，天真的以为就是在Entry[]上加个链式关系，如下图所示（这是错误的）：

百事不得其解，int index = (hash & 0x7FFFFFFF) % tab.length;这个有什么用

正文：转载于http://www.blogjava.net/fhtdy2004/archive/2009/07/03/285330.html

Java Hashtable分析

Hashtable的结构，采用的是数据结构中所说的链地址法处理冲突的方法
技术分享

从上面的结构图可以看出，Hashtable的实质就是一个数组＋链表。图中的Entry就是链表的实现，Entry的结构中包含了对自己的另一个实例的引用next，用以指向另外一个Entry。而图中标有数字的部分是一个Entry数组，数字就是这个Entry数组的index。那么往Hashtable增加键值对的时候，index会根据键的hashcode、Entry数组的长度共同决定，从而决定键值对存放在Entry数组的哪个位置。从这种意义来说，当键一定，Entry数组的长度一定的情况下，所得到的index肯定是相同的，也就是说插入顺序应该不会影响输出的顺序才对。然而，还有一个重要的因素没有考虑，就是计算index出现相同值的情况。譬如代码中 "sichuan" 和 "anhui"，所得到的index是相同的，在这个时候，Entry的链表功能就发挥作用了：put方法通过Entry的next属性获得对另外一个Entry的引用，然后将后来者放入其中。根据debug得出的结果，"sichuan", "anhui"的index同为2，"hunan"的index为6，"beijing"的index为1，在输出的时候，会以index递减的方式获得键值对。很明显，会改变的输出顺序只有"sichuan"和"anhui"了，也就是说输出只有两种可能："hunan" - "sichuan" - "anhui" - "beijing"和"hunan" - "anhui" - "sichuan" - "beijing"。以下是运行了示例代码之后，Hashtable的结果：

技术分享
在Hashtable的实现代码中，有一个名为rehash的方法用于扩充Hashtable的容量。很明显，当rehash方法被调用以后，每一个键值对相应的index也会改变，也就等于将键值对重新排序了。这也是往不同容量的Hashtable放入相同的键值对会输出不同的键值对序列的原因。在Java中，触发rehash方法的条件很简单：hahtable中的键值对超过某一阀值。默认情况下，该阀值等于hashtable中Entry数组的长度×0.75。

自 Java 2 平台 v1.2 以来，此类已经改进为可以实现 Map，因此它变成了 Java Collections Framework 的一部分。与新集合的实现不同，Hashtable 是同步的。

由迭代器返回的 Iterator 和由所有 Hashtable 的“collection 视图方法”返回的 Collection 的 listIterator 方法都是快速失败的：在创建 Iterator 之后，如果从结构上对 Hashtable 进行修改，除非通过 Iterator 自身的移除或添加方法，否则在任何时间以任何方式对其进行修改，Iterator 都将抛出 ConcurrentModificationException。因此，面对并发的修改，Iterator 很快就会完全失败，而不冒在将来某个不确定的时间发生任意不确定行为的风险。由 Hashtable 的键和值方法返回的 Enumeration 不是快速失败的。

注意，迭代器的快速失败行为无法得到保证，因为一般来说，不可能对是否出现不同步并发修改做出任何硬性保证。快速失败迭代器会尽最大努力抛出 ConcurrentModificationException。因此，为提高这类迭代器的正确性而编写一个依赖于此异常的程序是错误做法：迭代器的快速失败行为应该仅用于检测程序错误。

TestHashTable

Hashtable中定义几个内部类（包括静态的嵌套类和普通的内部类）
技术分享

Hashtable中的Entry数据结构

Entry

put方法:key的hash值不同但是可能放入的index相同，并且在放入之前需要判断

put方法

public synchronized Enumeration<K> keys() {
2 技术分享

return this.<K>getEnumeration(KEYS);
3 技术分享

}
4

private <T> Enumeration<T> getEnumeration(int type) {
6 技术分享

if (count == 0) {
7 技术分享

return (Enumeration<T>)emptyEnumerator;
8 技术分享

} else {
9 技术分享

return new Enumerator<T>(type, false);
10 技术分享

}
11

}
12

public synchronized Enumeration<V> elements() {
14 技术分享

return this.<V>getEnumeration(VALUES);
15 技术分享

}
16

Enumerator是Hashtable定义的一个内部类
18 技术分享

private class Enumerator<T> implements Enumeration<T>, Iterator<T> {
19 技术分享

Entry[] table = Hashtable.this.table;//访问宿主类的成员变量
20 技术分享

int index = table.length;
21 技术分享

Entry<K,V> entry = null;
22 技术分享

Entry<K,V> lastReturned = null;
23 技术分享

int type;
24 技术分享

/**
26

* Indicates whether this Enumerator is serving as an Iterator
27 技术分享

* or an Enumeration. (true -> Iterator).
28 技术分享

*/
29

boolean iterator;
30 技术分享

/**
32

* The modCount value that the iterator believes that the backing
33 技术分享

* Hashtable should have. If this expectation is violated, the iterator
34 技术分享

* has detected concurrent modification.
35 技术分享

*/
36

protected int expectedModCount = modCount;
37 技术分享

}
38

内部类中提供了访问了hashtable中的entry数组的方法.
39在实现Iterator接口中的方法时使用了expectedModCount变量来判断是否有并发修改而导致fast-fail，而在Enumeration的接口方法实现中没有判断
40 技术分享

public Set<K> keySet() {
44 技术分享

if (keySet == null)
45 技术分享

keySet = Collections.synchronizedSet(new KeySet(), this);
46 技术分享

return keySet;
47 技术分享

}
48

private class KeySet extends AbstractSet<K> {
49 技术分享

        public Iterator<K> iterator() {
50        return getIterator(KEYS);
51        }
52 技术分享

public int size() {
53 技术分享

return count;
54 技术分享

}
55

public boolean contains(Object o) {
56 技术分享

return containsKey(o);
57 技术分享

}
58

public boolean remove(Object o) {
59 技术分享

return Hashtable.this.remove(o) != null;
60 技术分享

}
61

public void clear() {
62 技术分享

Hashtable.this.clear();
63 技术分享

}
64

}
65

内部类KeySet中有iterator接口方法的实现，调用的宿主类的getIterator(KEYS)
66 技术分享

private <T> Iterator<T> getIterator(int type) {
67 技术分享

if (count == 0) {
68 技术分享

return (Iterator<T>) emptyIterator;
69 技术分享

} else {
70 技术分享

return new Enumerator<T>(type, true);
71 技术分享

}
72

}
73

getIterator中new 了一个新的内部类Enumerator的对象,最终使用Enumerator来访问hashtable的entry数组，能不能在内部类中直接创建一个内部类的的实例???
74 技术分享

public Collection<V> values() {
78 技术分享

if (values==null)
79 技术分享

values = Collections.synchronizedCollection(new ValueCollection(),
80 技术分享

this);
81

return values;
82 技术分享

}
83

ValueCollection也是一个内部类，结构和KeySet功能差不多
84 技术分享

public Set<Map.Entry<K,V>> entrySet() {
85 技术分享

if (entrySet==null)
86 技术分享

entrySet = Collections.synchronizedSet(new EntrySet(), this);
87 技术分享

return entrySet;
88 技术分享

}
89

EntrySet也是内部类，结构和KeySet功能差不多

posted on 2009-07-03 13:24 Frank_Fang 阅读(5958) 评论(1) 编辑收藏所属分类: Java编程