字符串哈希

时间：2019-09-01 11:08:48 阅读：101 评论：0 收藏：0 [点我收藏+]

标签：一个红黑树 == strlen 取模运算 class hash表溢出复杂度

hash_map 底层是hash表,查询时间复杂度是O(1)
map 底层是红黑树,查询时间复杂度是O(logn)

字符hash模板

进制哈希
首先设一个进制数base，并设一个模数mod
而哈希其实就是把一个数转化为一个值，这个值是base进制的，储存在哈希表中，注意一下在存入的时候取模一下即可

hash相当于加密设置，把一个字符串进行加密，得到一个数值

hash冲突

但是hash是存在hash冲突的
就比如所orzc的哈希值是233，而orzhjw的哈希值也是233
那么我们在查询的时候代码会认为这两个字符串是相同的，但显然这两个字符串是不同的

减少hash冲突

自然溢出法
双哈希法
单哈希法
无错哈希
多重哈希

自然溢出

#include <iostream>
#include <cstdio>
#include <algorithm>
#include <cstring>
#define ull unsigned long long
using namespace std;
ull base=131;
ull a[10010];
ull hashs(char s[]){
    int len=strlen(s);
    ull ans=0;
    for(int i=0;i<len;i++){
        ans=ans*base+(ull)s[i];
    }
    return ans&0x7fffffff;//除以无穷大，自然溢出
}
int main(){
    int n;
    scanf("%d",&n);
    for(int i=1;i<=n;i++){
        char str[10010];
        scanf("%s",str);
        a[i]=hashs(str);
    }

    sort(a+1,a+1+n);

    int cnt=1;
    for(int i=2;i<=n;i++){
        if(a[i]!=a[i-1])cnt++;
    }

    printf("%d\n",cnt);
    return 0;
}

单哈希
就是加一个取模运算，mod进行取模，只进行一次hashs运算

双哈希
进行两次hashs运算
两次hash进行比较

//因为有时候两个字符串不同，但hash相同，则只要保证两种hash有一个不同的话，那么两个字符串就肯定不同

#include <iostream>
#include <cstdio>
#include <algorithm>
#include <cstring>
#define ull unsigned long long
using namespace std;

struct data{
    ull x,y;
}a[10010];
ull base=131;
ull mod1=19260817;
ull mod2=19260813;//随便定义两个不同的大数

ull hash1(char s[]){
    int len=strlen(s);
    ull ans=0;
    for(int i=0;i<len;i++){
        ans=(ans*base+(ull)s[i])%mod1;
    }
    return ans;
}
ull hash2(char s[]){
    int len=strlen(s);
    ull ans=0;
    for(int i=0;i<len;i++){
        ans=(ans*base+(ull)s[i])%mod2;
    }
    return ans;
}
bool cmp(data a,data b){
    if(a.x==b.y)return a.y<b.y;
    return a.x<b.x;
}
int main(){
    int n;
    cin>>n;
    for(int i=1;i<=n;i++){
        char str[10010];
        scanf("%s",str);
        a[i].x=hash1(str);
        a[i].y=hash2(str);
    }

    sort(a+1,a+1+n,cmp);

    int cnt=1;
    for(int i=2;i<=n;i++){
        if(a[i].x!=a[i-1].x||a[i].y!=a[i-1].y)cnt++;//只要有一个不同即可
    }
    printf("%d\n",cnt);

    return 0;
}

字符串哈希

标签：一个红黑树 == strlen 取模运算 class hash表溢出复杂度

原文地址：https://www.cnblogs.com/Emcikem/p/11441521.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行