码迷,mamicode.com
首页 > 其他好文 > 详细

Uva 11468 改良版AC自动机

时间:2017-09-20 22:03:29      阅读:137      评论:0      收藏:0      [点我收藏+]

标签:存在   mes   code   push   name   mat   double   scanf   包含   

改良版AC自动机

UVa 11468

题意:给一些字符和各自出现的概率,在其中随机选择L次,形成长度为L的字符串S,给定K个模板串,求S不包含任意一个串的概率。

首先介绍改良版的AC自动机:

  • 传统的AC自动机,是当一个字符失配时,根据失配函数转移到指定地方,而这个失配函数,是通过一个宽搜的过程形成的,这时在匹配串的时候,就当匹配失败时,顺着失配指针走,直到可以匹配。然后匹配到单词结点,或者后缀链接是一个单词结点,这些前面的结点也是匹配单词。这就是传统的AC自动机。

现在将这个AC自动机改版优化:

  • 具体的变化是,计算失配指针的时候,当不存在某一个单词结点时,做一个虚结点,直接指向父亲结点的失配指针的位置,这样,当find查询匹配的时候,就不用判断当前结点是否存在,不存在则不断顺着失配边走。而是直接转到失配原来就预订好的位置。
  • 对于此题:各个模板串构成一个AC自动机,题目就转为在这个自动机上走L步,不踩中单词结点的概率。这个概率可以用全概率公式计算,当前结点*下一步也成功的概率。

Source Code :

技术分享
#include <bits/stdc++.h>
using namespace std;

const int SIGMA_SIZE = 64;
const int MAXNODE = 500;

int idx[256];
char s[30][30];
double prob[SIGMA_SIZE];
int n;


struct AhoCorasickAutomata
{
    int ch[MAXNODE][SIGMA_SIZE];
    int f[MAXNODE];
    int match[MAXNODE];
    int sz;

    void init()
    {
        sz = 1;
        memset(ch[0],0,sizeof(ch[0]));
    }

    void insert(char *s)
    {
        int u = 0,n = strlen(s);
        for(int i=0; i<n; i++)
        {
            int c = idx[s[i]];
            if(!ch[u][c])
            {
                memset(ch[sz],0,sizeof(ch[sz]));
                match[sz] = 0;
                ch[u][c] = sz++;
            }
            u = ch[u][c];
        }
        match[u] = 1;
    }

    void getFail()
    {
        queue<int> q;
        f[0] = 0;
        for(int c=0; c<SIGMA_SIZE; c++)
        {
            int u = ch[0][c];
            if(u)
            {
                f[u] = 0;
                q.push(u);
            }
        }

        while(!q.empty())
        {
            int r = q.front();
            q.pop();
            for(int c=0; c<SIGMA_SIZE; c++)
            {
                int u = ch[r][c];
                if(!u)
                {
                    ch[r][c]=ch[f[r]][c];
                    continue;
                }
                q.push(u);
                int v = f[r];
                while(v&&!ch[v][c])
                    v = f[v];
                f[u] = ch[v][c];
                match[u] |=match[f[u]];
            }
        }
    }
};

AhoCorasickAutomata ac;

double d[MAXNODE][105];
int vis[MAXNODE][105];

double getProb(int u,int l)
{
    if(!l) return 1.0;
    if(vis[u][l]) return d[u][l];
    vis[u][l] = 1;
    double& ans = d[u][l];
    ans = 0.0;
    for(int i=0; i<n; i++)
    {
        if(!ac.match[ac.ch[u][i]])
            ans += prob[i]*getProb(ac.ch[u][i],l-1);
    }
    return ans;
}


int main()
{
    freopen("in.txt","r",stdin);
    int T;
    scanf("%d",&T);
    for(int kase = 1; kase<=T; kase ++)
    {
        int k,l;
        scanf("%d",&k);
        for(int i=0; i<k; i++)
            scanf("%s",s[i]);

        scanf("%d",&n);
        for(int i=0; i<n; i++)
        {
            char ch[9];
            scanf("%s%lf",ch,&prob[i]);
            idx[ch[0]] = i;
        }

        ac.init();
        for(int i=0; i<k; i++)
            ac.insert(s[i]);
        ac.getFail();
        scanf("%d",&l);
        memset(vis,0,sizeof(vis));
        printf("Case #%d: %.6lf\n",kase,getProb(0,l));
    }

    return 0;
}
View Code

 

Uva 11468 改良版AC自动机

标签:存在   mes   code   push   name   mat   double   scanf   包含   

原文地址:http://www.cnblogs.com/TreeDream/p/7565032.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!