码迷,mamicode.com
首页 > 其他好文 > 详细

POJ2778 DNA Sequence

时间:2020-01-12 20:28:51      阅读:103      评论:0      收藏:0      [点我收藏+]

标签:怎么办   cpp   namespace   mod   getc   dig   algorithm   题意   empty   

POJ2778 DNA Sequence

题意 :给 m 个字符串(只包含 A , T , C , G ), 问有多少长度为 n 的字符串不含有这 m 个字串

? 0 <= m <= 10 , 1 <= n <=2000000000,字符串长度不超过10

题解

? 这是一个字符串匹配问题,我们首先想到 AC 自动机,建完 AC 自动机后怎么操作呢,因为字符串是不确定的,我们想到了动态规划。

? 一个字符串,我们在它后面加上一个字符,如果它还是不含这 m 个字串,那就说明这个字符是可以加上去的,那么我们就成功的把 n 长度的状态转移到了 n+1 长度的状态。

? 这个题的算法就出来了,我们在 AC 自动机上进行计数 dp,对于每一个节点,我们考虑在它后面添加字符,如果添加完后转移到的节点及其所有的 fail 指针没有指向字符结尾的节点,说明这是一个有效转移.

f[i] [j]代表长度为i的字符串在j节点时的方案数,起始状态 f[0] [0]=1.

Q :n 是20亿怎么办?

A : 发现每一次转移的方程都是一样的,我们改用矩阵进行转移,用矩阵快速幂就可以做到复杂度为
\[ \sum^{m}_{i=1} length\ of\ string*log n \]
这种题居然写了100行


#include<iostream>
#include<cstdio>
#include<algorithm>
#include<cstring>
#include<queue>
using namespace std;
int read()
{
    int k=0,f=1;char c=getchar();
    for(;!isdigit(c);c=getchar()) if(c=='-') f=-1;
    for(;isdigit(c);c=getchar()) k=k*10+c-'0';return k*f;
}
const int N=405;
const int mod=100000;
int n,m,L;
int tot,ch[N][4],val[N],fail[N];
char s[N];
queue<int> q;
struct matrix
{
    long long a[105][105];
    matrix() {memset(a,0,sizeof(a));}
    matrix operator *(const matrix &b) 
    {
        matrix c;
        for(int i=0;i<=tot;i++)
            for(int j=0;j<=tot;j++)
                for(int k=0;k<=tot;k++)
                    c.a[i][j]=(c.a[i][j]+a[i][k]*b.a[k][j])%mod;    
        return c;
    }
};
int Pow(int x,int k) {int ans=1;for(;k;k>>=1,x=1ll*x*x%mod) if(k&1) ans=1ll*ans*x%mod;return ans;}
int get(char x)
{
    if(x=='A') return 0;
    else if(x=='T') return 1;
    else if(x=='C') return 2;
    return 3;
}
void ins(char *s)
{
    int now=0;
    for(int i=0;s[i];i++)
    {
        int x=get(s[i]);
        if(!ch[now][x]) tot++,ch[now][x]=tot;
        now=ch[now][x];
    }
    val[now]=1;
}
void build()
{
    for(int i=0;i<4;i++)
        if(ch[0][i]) q.push(ch[0][i]);
    while(!q.empty())
    {
        int u=q.front();q.pop();
        for(int i=0;i<4;i++)
            if(!ch[u][i]) ch[u][i]=ch[fail[u]][i];
            else fail[ch[u][i]]=ch[fail[u]][i],q.push(ch[u][i]);
    }
}
matrix ksm(matrix a,int p)
{
    matrix c;
    c.a[0][0]=1;
    for(;p;p>>=1,a=a*a)
        if(p&1)
            c=c*a;
    return c;
}
int main()
{
    m=read();n=read();
    if(!m) {printf("%d\n",Pow(4,n));return 0;}
    for(int i=1;i<=m;i++)
        scanf("%s",s),ins(s);
    build();
    matrix a,b;
    for(int i=0;i<=tot;i++)
    {
        for(int j=0;j<4;j++)
        {
            int fl=1;
            for(int k=i;;k=fail[k])
            {
                if(val[ch[k][j]]) 
                {
                    fl=0;
                    break;
                }
                if(!k) break; 
            }
            a.a[i][ch[i][j]]+=fl;
        }
    }
    b=ksm(a,n);
    int ans=0;
    for(int i=0;i<=tot;i++)
        for(int j=0;j<=tot;j++)
            ans=(ans+b.a[i][j])%mod;
    printf("%d\n",ans);
    return 0;
}

POJ2778 DNA Sequence

标签:怎么办   cpp   namespace   mod   getc   dig   algorithm   题意   empty   

原文地址:https://www.cnblogs.com/waing/p/12183480.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!