码迷,mamicode.com
首页 > 其他好文 > 详细

POJ2778 DNA sequence

时间:2015-12-19 13:44:30      阅读:223      评论:0      收藏:0      [点我收藏+]

标签:

题目大意:给出m个疾病基因片段(m<=10),每个片段不超过10个字符。求长度为n的不包含任何一个疾病基因片段的DNA序列共有多少种?(n<=2000000000)

分析:本题需要对m个疾病基因片段构建一个AC自动机,自动机中的每个节点表示一个状态。其中AC自动机中的叶子节点表示的是病毒,所以是非法状态。同时,如果某个节点到根的字符串的后缀是一个病毒,那么该节点也是非法状态。剔除掉所有的非法状态,那么剩下的节点都表示合法状态了。然后用节点的nxt指针表示状态之间转化关系。若nxt[i]==0,则nxt[i]指针指向当前节点fail指针的nxt[i],如果仍然为0,则nxt[i]指向根节点。这样处理以后,每个指针都不会指向0。这样,该自动机可以看做是一个合法状态的转换图,节点表示各种合法状态,边表示添加一个字符将转换为另一个状态。于是我们可以得到一个矩阵。该矩阵实际上表示该状态图的邻接矩阵。对该矩阵自乘n次。最后结果矩阵的第1行各元素之和表示从空状态添加n个字符能够得到的所有合法状态的数量。

矩阵的思想非常巧妙。

#include<iostream>
#include<cstdio>
#include<cstring>
using namespace std;
#define MAXN 102
#define MAXL 12
#define MAXC 4
#define MOD 100000
struct node
{
	int fail,nxt[6],flag;
}trie[MAXN];
int head,tail,myq[MAXN],root=1,tot=1;
char word[MAXL];
int degree;
int a[MAXN][MAXN],b[MAXN][MAXN],c[MAXN][MAXN],(*ans)[MAXN];
void multi(int (*a)[MAXN],int (*b)[MAXN],int (*c)[MAXN])
{
   for(int i=1;i<=degree;i++)
  {
    for(int j=1;j<=degree;j++)
    c[i][j]=0;
  }
  for(int i=1;i<=degree;i++)
  {
    for(int j=1;j<=degree;j++)
    {
     for(int k=1;k<=degree;k++)
     {
         c[i][j]+=(long long)a[i][k]*b[k][j]%MOD;
         c[i][j]%=MOD;
     }
    }
  }
}
void power(int (*t1)[MAXN],int h)
{
    for(int i=1;i<=degree;i++)
        for(int j=1;j<=degree;j++)
         b[i][j]=0;
    for(int i=1;i<=degree;i++)
          b[i][i]=1;
    int (*t2)[MAXN],(*t3)[MAXN];
    t2=b,t3=c;
    while(h)
    {
       if(h&1)
         {multi(t1,t2,t3);
          swap(t2,t3);
         }
         h>>=1;
         multi(t1,t1,t3);
         swap(t1,t3);
    }
    if(t2!=a)
    {
        memcpy(a,t2,sizeof a);
    }
}
int inline getid(char C)
{
	if(C==‘A‘)return 0;
		else if(C==‘T‘)return 1;
	     else if(C==‘C‘)return 2;
	else return 3;
}
void insert(int r,char *s)
{
	int len=strlen(s);
	for(int i=0;i<len;i++)
	{
		int val=getid(s[i]);
		if(trie[r].nxt[val]==0)
			trie[r].nxt[val]=++tot;
		r=trie[r].nxt[val];
	}
	trie[r].flag=1;//1表示结束节点
}
void build(int r)
{
	trie[r].fail=r;
	myq[tail++]=r;
	int ch;
	while(head<tail)
	{
	  	r=myq[head++];
		for(int i=0;i<MAXC;i++)
		{
			ch=trie[r].nxt[i];
			if(ch)myq[tail++]=ch;
			if(r==root)
			{
			    if(ch)
				trie[ch].fail=root;
				else trie[r].nxt[i]=root;
			}
			else
			{
				if(ch)
				{trie[ch].fail=trie[trie[r].fail].nxt[i];
				  trie[ch].flag|=trie[trie[ch].fail].flag;
				}
				else
				trie[r].nxt[i]=trie[trie[r].fail].nxt[i];
			}
		    ch=trie[r].nxt[i];
			if(trie[ch].flag!=1)
				a[r][ch]++;
		}
	}
}
int main()
{
	int n,m;
	scanf("%d%d",&m,&n);
	for(int i=0;i<m;i++)
	{
		scanf("%s",word);
		insert(root,word);
	}
	build(root);
	degree=tot;
    power(a,n);
	int ans=0;
	for(int i=1;i<=degree;i++)
	{ans+=a[1][i];
    ans%=MOD;
	}
	printf("%d\n",ans);
}

  

POJ2778 DNA sequence

标签:

原文地址:http://www.cnblogs.com/hefenghhhh/p/5056768.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!