码迷,mamicode.com
首页 > 其他好文 > 详细

HDU 2846 (AC自动机+多文本匹配)

时间:2015-05-27 15:27:55      阅读:113      评论:0      收藏:0      [点我收藏+]

标签:

题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=2846

题目大意:有多个文本,多个模式串。问每个模式串中,有多少个文本?(匹配可重复)

解题思路

传统AC自动机是计算单个文本中,模式串出现次数。

这里比较特殊,每个文本需要单独计算,而且每个匹配在每个文本中只能计数1次。

比如add,d只能计数1次,而不是;两次。

所以循环逐个对文本Find。每个Find里,进行Hash,保证每个匹配串只计数1次。

由于匹配串可重复,在Insert之前,也需要离散化Hash一下,把重复的下标,指向最先插入的下标。

另外,本题会卡掉不正确AC自动机模板( Find里要写成While(last!=root)而不是While(last->cnt)  )

代码

#pragma comment(linker, "/STACK:1024000000,1024000000")
#include "cstdio"
#include "cstring"
#include "string"
#include "iostream"
#include "queue"
#include "vector"
#include "algorithm"
#include "map"
using namespace std;
#define maxn 26
int ans[100005],mt[100005];
string P[10005];
struct Trie
{
    Trie *next[maxn],*fail;
    int cnt;
}*root;
Trie *newnode()
{
    Trie *ret=new Trie;
    memset(ret->next,0,sizeof(ret->next));
    ret->fail=0;
    ret->cnt=0;
    return ret;
}
void init() {root=newnode();}
void Insert(string str,int index)
{
    Trie *pos=root;
    for(int i=0;i<str.size();i++)
    {
        int c=str[i]-a;
        if(!pos->next[c]) pos->next[c]=newnode();
        pos=pos->next[c];
    }
    pos->cnt=index;
}
void getfail()
{
    queue<Trie *> Q;
    for(int c=0;c<maxn;c++)
    {
        if(root->next[c])
        {
            root->next[c]->fail=root;
            Q.push(root->next[c]);
        }
        else root->next[c]=root;
    }
    while(!Q.empty())
    {
        Trie *x=Q.front();Q.pop();
        for(int c=0;c<maxn;c++)
        {
            if(x->next[c])
            {
                x->next[c]->fail=x->fail->next[c];
                Q.push(x->next[c]);
            }
            else x->next[c]=x->fail->next[c];
        }
    }
}
void Find(string str)
{
    map<int,int> Hash;
    Trie *pos=root,*last;
    for(int i=0;i<str.size();i++)
    {
        int c=str[i]-a;last;
        if(c<0||c>maxn) {pos=root;continue;}
        if(pos->next[c])
        {
            pos=pos->next[c];
            last=pos;
            while(last!=root)
            {
                if(!Hash.count(last->cnt))
                {
                    ans[last->cnt]++;
                    Hash[last->cnt]++;
                }
                last=last->fail;
            }
        }
    }
}
int main()
{
    //freopen("in.txt","r",stdin);
    ios::sync_with_stdio(false);
    int n,m,s;
    string tmp;
    while(cin>>n)
    {
        map<string,int> ms;
        memset(ans,0,sizeof(ans));
        memset(mt,0,sizeof(mt));
        init();
        for(int i=1;i<=n;i++) cin>>P[i];
        cin>>s;
        for(int i=1;i<=s;i++)
        {
            cin>>tmp;
            if(!ms.count(tmp))
            {
                Insert(tmp,i);
                ms[tmp]=i;
                mt[i]=i;
            }
            else mt[i]=ms[tmp];
        }
        getfail();
        for(int i=1;i<=n;i++) Find(P[i]);
        for(int i=1;i<=s;i++) cout<<ans[mt[i]]<<endl;
    }
}

 

 

HDU 2846 (AC自动机+多文本匹配)

标签:

原文地址:http://www.cnblogs.com/neopenx/p/4533276.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!