码迷,mamicode.com
首页 > 编程语言 > 详细

PHP核心技术与最佳实践之Hash算法

时间:2015-04-15 09:45:39      阅读:159      评论:0      收藏:0      [点我收藏+]

标签:hash   php核心技术与最佳实践之hash算法   

PHP核心技术与最佳实践之Hash算法

Hash表又称散列表,通过把关键字Key映射到数组中的一个位置来访问记录,以加快查找速度。这个映射函数称为Hash函数,存放记录的数组称为Hash表。

1.     Hash函数

作用是把任意长度的输入,通过Hash算法变换成固定长度的输出,该输出就是Hash值。这种转换是一种压缩映射,也就是Hash值得空间通常远小于输入的空间,不输入可能会散列成相同的输出,而不可能从Hash值来唯一的确定输入值。

一个好的hash函数应该满足以下条件:每个关键字都可以均匀的分布到Hash表任意一个位置,并与其他已被散列到Hash表中的关键字不发生冲突。这是Hash函数最难实现的。

2.     Hash算法

1)    直接取余法

直接取余法比较简单,直接用关键字k除以Hash表的大小m取余数,算法如下:

H(k) = k mod m

例如:Hash表的大小为m=12,所给关键字为k=100,则h(k) = 4.这种算法是一个求余操作,速度比较快。

2)    乘积取整法

乘积取整法首先使用关键字k乘以一个常数A(0<A<1),并抽取kA的小数部分,然后用Hash表大小m乘以这个值,再取整数部分即可。算法如下:

H(k) = floor (m*(kA mod 1))

其中,kA mod1表示kA的小数部分,floor是取整操作。

当关键字是字符串的时候,就不能用上面的Hash算法。因为字符串是由字符组成,所以可以把字符串所有的字符的ASCII码加起来得到一个整数,然后再按照上面的Hash算法去计算即可。

算法如下:

Function hash($key,$m){

         $strlen= strlen($key);

         $hashval= 0;

         For($i=0;$i< $strlen;$i++){

       $hashval+=ord($key{$I});

}

Return $hashval % $m;

}

3)    经典Hash算法Times33

Unsigned int DJBHash(char *str){

         Unsignedint hash = 5381;

         While(*str){

       Hash+=(hash <<5)+(*str++);

}

Return (hash &0x7FFFFFFF)

}

算法思路就是不断乘以33,其效率和随机性都非常好,广泛运用于多个开源项目中,如Apache、Perl和PHP等。

3.     Hash

Hash表的时间复杂度为O(1),Hash表结构可用图表示:

技术分享


要构造一个Hash表必须创建一个足够大的数组用于存放数据,另外还需要一个Hash函数把关键字Key映射到数组的某个位置。

Hash表的实现步骤:

1)    创建一个固定大小的数组用于存放数据。

2)    设计Hash函数。

3)    通过Hash函数把关键字映射到数组的某个位置,并在此位置上进行数据存取。

4.     使用PHP实现Hash

首先创建一个HashTable类,有两个属性$buckets和$size。$buckets用于存储数据的数组,$size用于记录$buckets数组大小。然后在构造函数中为$buckets数组分配内存。代码如下:

<?PHP

        ClassHashTable{

               Private$buckets;

               Private$size =10;

               Publicfunction __construct(){

              $this-> buckets =new SplFixedArray($this->size);

}

}

?>

在构造函数中,为$buckets数组分配了一个大小为10的数组。在这里使用了SPL扩展的SplFixedArray数组,不是一般的数组(array)

这是因为SplFixedArray数组更接近于C语言的数组,而且效率更高。在创建其数组时需要为其提供一个初始化的大小。

注意:要使用SplFixedArray数组必须开启SPl扩展。如果没有开启,可以使用一般的数组代替。

接着为Hash表指定一个Hash函数,为了简单起见,这里使用最简单的Hash算法。也就是上面提到了把字符串的所有字符加起来再取余。代码如下:

 

 

 

Public Function hashfunc($key){

         $strlen= strlen($key);

         $hashval= 0;

         For($i=0;$i< $strlen;$i++){

       $hashval+=ord($key{$I});

}

Return $hashval % $this->size;

}

有了Hash函数,就可以实现插入和查找方法。插入数据时,先通过Hash函数计算关键字所在Hash表的位置,然后把数据保存到此位置即可。代码如下:

Public function insert($key,$val){

        $index= $this -> hashfunc($key);

        $this-> buckets[$index] = $val;

}

查找数据方法与插入数据方法相似,先通过Hash函数计算关键字所在Hash表的位置,然后返回此位置的数据即可。代码如下:

Public function find($key){

        $index= $this -> hashfunc($key);

        Return$this ->buckets[$index];

}

至此,一个简单的Hash表编写完成,下面测试这个Hash表。代码清单如下:

<?PHP

        $ht= new HashTable();

        $ht->insert(‘key1’,’value1’);

        $ht->insert(‘key2’,’value2’);

        Echo$ht ->find(‘key1’);

        Echo$ht ->find(‘key2’);

?>

完整代码:#hash.php

<?PHP
             Class HashTable{
                    Private$buckets;
                    Private $size=10;
                    Public function__construct(){
                           $this-> buckets =new SplFixedArray($this->size);
                    }
                    PublicFunction hashfunc($key){
                           $strlen= strlen($key);
                           $hashval= 0;
                           For($i=0;$i< $strlen;$i++){
                                  $hashval+=ord($key{$i});
                           }
                           return$hashval % $this->size;
                    }
                    Publicfunction insert($key,$val){
                           $index= $this -> hashfunc($key);
                           $this-> buckets[$index] = $val;
                    }
                    Publicfunction find($key){
                           $index= $this -> hashfunc($key);
                           Return$this ->buckets[$index];
                    }
 
 
             }
             $ht = newHashTable();
             $ht->insert('key1','value1');
             $ht->insert('key2','value2');
             Echo $ht->find('key1');
             Echo $ht->find('key2');
 
?>


PHP核心技术与最佳实践之Hash算法

标签:hash   php核心技术与最佳实践之hash算法   

原文地址:http://blog.csdn.net/u012675743/article/details/45048369

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!