码迷,mamicode.com
首页 > 其他好文 > 详细

散列表

时间:2015-06-17 09:44:49      阅读:125      评论:0      收藏:0      [点我收藏+]

标签:数据结构   散列函数   

                                                                                        散列表

  前几天看《linux内核设计与实现》的时候,发现一个新名词(对于我来说)“散列表”,直接给我看蒙住了,散列表是个什么鬼,于是今天晚上找了本数据结构的书,来学习下散列表这个新东西。

      散列表:

                   既是一种存储的技术,又是一种查找的技术,也就是说可以用它来查找与存储,不同于一般的存储与查找,一般正常的存储,举个例子一个已经存在的数组,其中每一个数据内容与它的下标都是一一对应的关系,需要查找时就进行一次遍历要么找到,要么没找到。很直接,要找的内容都是固定的,但是散列表并不用来处理这类查找。散列表把你需要查找的关键字与其下标建立了一种关系,就像上面所说过的,一个数组的下标和它里面存在的内容没有半毛钱的关系。但是散列表则不然,散列表把存储的东西与下标建立了一种有规则的关系,这种规则你自己定。但是定的方法很讲究,一会再说。

   还是给一个关于散列表的官方定义吧

   散列表:

散列表(Hash table,也叫哈希表),是根据关键码值(Key value)而直接进行访问的数据结构。也就是说,它通过把关键码值映射到表中一个位置来访问记录,以加快查找的速度。这个映射函数叫做散列函数,存放记录的数组叫做散列表
给定表M,存在函数f(key),对任意给定的关键字值key,代入函数后若能得到包含该关键字的记录在表中的地址,则称表M为哈希(Hash)表,函数f(key)为哈希(Hash) 函数。
 以上定义来自百度百科。
   其实和我说的差不多,那个有规则的关系就是哈希函数。可以同时定义多个哈希函数。
现在来说说散列表的构造方法:
    直接定址法:
取关键字的某个线性函数值为散列表地址
         f(key) = a * key + b;
   数字分析法:
         将某些特定的数字进行处理,例如131XXXXX1234,132XXXXX6789.。。。。例如这些手机号,其实只有后边的4位数字是相同的那么我们,就应当取处后面的4位进行比较甄别。
         简单来说就是屏蔽掉重复的数字,主要处理那些能够表征问题的数字。
平方取中法:
          就是如字面意思将一个数字平方然后取中间的某几位数字,其实做了这么多只是为了排除那些重复的关键字,这是我们的原则,根据不同的需求选择不同的哈希方法,如果有人可以想出万用的哈希函数,那么也不失为一个壮举。
 除留余数法:
         就是给定的东西取余,得出余数,以余数作为存储的下标,当然余数是很可能相同的所以如果出现相同的情况就对除数+1,一直这样下去,直到找出可以放置的位置为止。
还有随机数法,溢出数表。。。。。多种方法,原则就是打造出适合问题的哈希函数。
下面贴上一个代码:就是使用余数法建议一个散列表,这个散列表初始化位5个存储位置,首先进行5个数字的存入操作,然后可以输入一个数字,查找出它在散列表中的存储位置。


#include<stdlib.h>
#include<string.h>
#define SUCCESS 1
#define UNSUCCESS 0
#define HASHSIZE  12
#define NULLKEY   -32768
#define OK        2

typedef struct hashtable{
    int *elem;   //数据元素存储基址,动态分配数组
    int count;   //当前数据元素个数
}HASHTABLE;

int m = 5;       //散列表表长

int init_hashtable(HASHTABLE *H)    //初始化散列表
{
    int i;           
    H->count = m;
    H->elem  = (int *)malloc(m*sizeof(int));
    if(H->elem == NULL){
        printf("malloc error :%d\n",__LINE__);
    }
    for(i = 0;i<m;i++)
    {
        H->elem[i] = NULLKEY;
    }
    return OK;
}


int HASH(int key)           //散列函数
{
    return key % m;
}
void inserthash(HASHTABLE *H,int key)    //插入关键字进散列表
{
    int addr = HASH(key);               //求散列表
    while(H->elem[addr] != NULLKEY)     //如果不为空,则冲突
        addr = (addr+1)%m;              //开放定址法的线性探测
    H->elem[addr] = key;                //直到有空位后插入关键字
}

int searchhash(HASHTABLE H,int obj,int *addr)  //散列表查找关键字
{
    *addr = HASH(obj);                      //求散列表地址
    while(H.elem[*addr]!= obj)               //如果不为空则冲突
    {
        *addr = (*addr+1)%m;                //开放定址法的线性探测
        if(H.elem[*addr] == NULLKEY || *addr == HASH(obj))
        {                         //如果循环回到原点
            return UNSUCCESS;         //则说明关键字不存在
        }
    }
    return SUCCESS;
}

int main()
{
    HASHTABLE H = {NULL,0}; 
    int key;
    int obj;
    int addr;
    int ret;
    init_hashtable(&H);    //初始化散列表
    int i = 5;
    for(i=0;i<5;i++)
    {
     printf("please enter your key:");
     scanf("%d",&key);
     inserthash(&H,key);    //插入关键字进散列表
     key = 0;
    }
    printf("please enter what number you want:");
    scanf("%d",&obj);
    ret = searchhash(H,obj,&addr);  //散列表查找关键字
    if(ret == 0){
        printf("sorry no obj\n");
    }else{
        printf("yes we find it %d\n",addr);
    }
    return 0;
}


散列表

标签:数据结构   散列函数   

原文地址:http://blog.csdn.net/zmrlinux/article/details/46523665

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!