标签:lan cpu 定位 映射 数位 math ssi 转换 img
散列表(Hash table,也叫哈希表),是根据键(Key)而直接访问在内存储存位置的数据结构。也就是说,它通过计算一个关于键值的函数,将所需查询的数据映射到表中一个位置来访问记录,这加快了查找速度。这个映射函数称做散列函数,存放记录的数组称做散列表。
例如,在通讯录中要存储姓名和电话号码,此时将姓名作为key,号码作为value,姓名到首字母的计算方法作为哈希函数,整个通讯里作为哈希表。当我们要查找某个姓名对应的号码时,先计算它的首字母,再到该首字母对应的表下查找key。此方法显然要比从所有无序的姓名中查找要快速。由此可见,key也是存储信息的一部分,且key是独一无二的,而多个人的首字母可能是同一字母,这就造成了哈希冲突。关于查找,往往计算哈希函数的时间是极短的,查找就需要在造成哈希冲突的键值对中遍历。当我们要存储成双成对的信息时,就可以使用散列表。
散列函数:
散列函数能使对一个数据序列的访问过程更加迅速有效,通过散列函数,数据元素将被更快定位。
冲突解决:
查找效率:
散列表的查找过程基本上和造表过程相同。一些关键码可通过散列函数转换的地址直接找到,另一些关键码在散列函数得到的地址上产生了冲突,需要按处理冲突的方法进行查找。在介绍的三种处理冲突的方法中,产生冲突后的查找仍然是给定值与关键码进行比较的过程。所以,对散列表查找效率的量度,依然用平均查找长度来衡量。查找过程中,关键码的比较次数,取决于产生冲突的多少,产生的冲突少,查找效率就高,产生的冲突多,查找效率就低。因此,影响产生冲突多少的因素,也就是影响查找效率的因素。影响产生冲突多少有以下三个因素:1,散列函数是否均匀;2,处理冲突的方法,3,负载因子。
负载因子: = 填入表中的元素个数 / 散列表的长度。
是散列表装满程度的标志因子。由于表长是定值,与“填入表中的元素个数”成正比,所以,越大,表明填入表中的元素越多,产生冲突的可能性就越大;反之,越小,标明填入表中的元素越少,产生冲突的可能性就越小。实际上,散列表的平均查找长度是载荷因子的函数,只是不同处理冲突的方法有不同的函数。
对于开放定址法,荷载因子是特别重要因素,应严格限制在0.7-0.8以下。超过0.8,查表时的CPU缓存不命中(cache missing)按照指数曲线上升。因此,一些采用开放定址法的hash库,如Java的系统库限制了荷载因子为0.75,超过此值将resize散列表。
标签:lan cpu 定位 映射 数位 math ssi 转换 img
原文地址:https://www.cnblogs.com/faded828x/p/13124213.html