标签:一个 处理 优化 阈值 迭代 常用 继承 容量 工作原理
HashMap的特性:HashMap存储键值对,实现快速存取数据;允许null键/值;非同步;实现map接口。
HashMap是基于hashing的原理,底层使用哈希表(数组 + 链表)实现。里边最重要的两个方法put、get,使用put(key, value)存储对象到HashMap中,使用get(key)从HashMap中获取对象。
存储对象时,我们将K/V传给put方法时,它调用hashCode计算hash从而得到bucket位置,进一步存储,HashMap会根据当前bucket的占用情况自动调整容量(超过Load Facotr则resize为原来的2倍)。获取对象时,我们将K传给get,它调用hashCode计算hash从而得到bucket位置,并进一步调用equals()方法确定键值对。如果发生碰撞的时候,Hashmap通过链表将产生碰撞冲突的元素组织起来,在Java 8中,如果一个bucket中碰撞冲突的元素超过某个限制(默认是8),则使用红黑树来替换链表,从而提高速度。
1.对key的hashCode做hash操作,然后再计算在bucket中的index(1.5 HashMap的哈希函数);
2.如果没碰撞直接放到bucket里;
3.如果碰撞了,以链表的形式存在buckets后;
4.如果节点已经存在就替换old value(保证key的唯一性)
5.如果bucket满了(超过阈值,阈值=loadfactor*current capacity,load factor默认0.75),就要resize。
通过对key的hashCode()进行hashing,并计算下标,从而获得buckets的位置。如果产生碰撞,则调用用key.equals()方法。
HashMap中处理冲突的方法实际就是链地址法,内部数据结构是数组+单链表。
开放定址法、再哈希法。
重点在于理解hashCode()与equals()。
通过对key的hashCode()进行hashing,并计算下标,从而获得buckets的位置。两个键的hashcode相同会产生碰撞,则利用key.equals()方法去链表或树(java1.8)中去查找对应的节点。
将链表转为红黑树。JDK1.8 已经实现了。
扩容。这个过程也叫作rehashing,因为它重建内部数据结构,并调用hash方法找到新的bucket位置。
大致分两步:
1.扩容:容量扩充为原来的两倍(2 * table.length);
2.移动:对每个节点重新计算哈希值,重新计算每个元素在数组中的位置,将原来的元素移动到新的哈希表中。
补充:
loadFactor:加载因子。默认值0.75;
capacity:容量;
threshold:阈值=capacity*loadFactor。当HashMap中存储数据的数量达到threshold时,就需要将HashMap的容量加倍(capacity*2);
size:HashMap的大小,它是HashMap保存的键值对的数量。
String, Interger这样的类作为HashMap的键是再适合不过了,而且String最为常用。
因为String对象是不可变的,而且已经重写了equals()和hashCode()方法了。
1.不可变性是必要的,因为为了要计算hashCode(),就要防止键值改变,如果键值在放入时和获取时返回不同的hashcode的话,那么就不能从HashMap中找到你想要的对象。不可变性还有其他的优点如线程安全。
2.因为获取对象的时候要用到equals()和hashCode()方法,那么键对象正确的重写这两个方法是非常重要的。如果两个不相等的对象返回不同的hashcode的话,那么碰撞的几率就会小些,这样就能提高HashMap的性能。
Hashtable可以看做是线程安全版的HashMap。Hashtable几乎在每个方法上都加上synchronized(同步锁),实现线程安全。
1.HashMap继承于AbstractMap,而Hashtable继承于Dictionary;
2.线程安全不同。Hashtable的几乎所有函数都是同步的,即它是线程安全的,支持多线程。而HashMap的函数则是非同步的,它不是线程安全的。若要在多线程中使用HashMap,需要我们额外的进行同步处理;
3.null值。HashMap的key、value都可以为null。Hashtable的key、value都不可以为null;
4.迭代器(Iterator)。HashMap的迭代器(Iterator)是fail-fast迭代器,而Hashtable的enumerator迭代器不是fail-fast的。所以当有其它线程改变了HashMap的结构(增加或者移除元素),将会抛出ConcurrentModificationException。
5.容量的初始值和增加方式都不一样:HashMap默认的容量大小是16;增加容量时,每次将容量变为“原始容量x2”。Hashtable默认的容量大小是11;增加容量时,每次将容量变为“原始容量x2 + 1”;
6.添加key-value时的hash值算法不同:HashMap添加元素时,是使用自定义的哈希算法。Hashtable没有自定义哈希算法,而直接采用的key的hashCode()。
7.速度。由于Hashtable是线程安全的也是synchronized,所以在单线程环境下它比HashMap要慢。如果你不需要同步,只需要单一线程,那么使用HashMap性能要好过Hashtable。
HashMap可以通过下面的语句进行同步:Map m = Collections.synchronizeMap(hashMap)
标签:一个 处理 优化 阈值 迭代 常用 继承 容量 工作原理
原文地址:https://www.cnblogs.com/bzywns/p/9585992.html