标签:
如果一个字符串可以被拆分为 AABB 的形式,其中 A 和 B 是任意非空字符串, 则我们称该字符串的这种拆分是优秀的。
例如,对于字符串 aabaabaa,如果令 A = aab, B = a, 我们就找到了这个字符串拆分成 AABB 的一种方式。
一个字符串可能没有优秀的拆分,也可能存在不止一种优秀的拆分。 比如我们令 A = a, B = baa,也可以用 AABB 表示出上述字符串;但是,字符串abaabaa 就没有优秀的拆分。
现在给出一个长度为 n 的字符串 S,我们需要求出,在它所有子串的所有拆分方式中,优秀拆分的总个数。 这里的子串是指字符串中连续的一段。
以下事项需要注意:
1. 出现在不同位置的相同子串,我们认为是不同的子串,它们的优秀拆分均会被计入答案。
2. 在一个拆分中,允许出现 A = B。例如 cccc 存在拆分 A = B = c。
3. 字符串本身也是它的一个子串。
每个输入文件包含多组数据。输入文件的第一行只有一个整数 T,表示数据 的组数。保证 1 ≤ T ≤ 10。
接下来 T 行,每行包含一个仅由英文小写字母构成的字符串 S,意义如题 所述。
输出 T 行,每行包含一个整数,表示字符串 S 所有子串的所有拆分中, 总共有多少个是优秀的拆分。
4 aabbbb cccccc aabaabaabaa bbaabaababaaba
3 5 4 7
我们用 S[i, j] 表示字符串 S 第 i 个字符到第 j 个字符的子串(从 1 开 始计数)。
第一组数据中,共有 3 个子串存在优秀的拆分:
S[1,4] = aabb,优秀的拆分为 A = a, B = b;
S[3,6] = bbbb,优秀的拆分为 A = b, B = b;
S[1,6] = aabbbb,优秀的拆分为 A = a, B = bb。
而剩下的子串不存在优秀的拆分,所以第一组数据的答案是 3。
第二组数据中, 有两类,总共 4 个子串存在优秀的拆分:
对于子串 S[1,4] = S[2,5] = S[3,6] = cccc, 它们优秀的拆分相同,均为 A = c, B = c,但由于这些子串位置不同,因此要计算 3 次;
对于子串 S[1,6] = cccccc,它优秀的拆分有 2 种: A = c, B = cc 和 A = cc, B = c,它们是相同子串的不同拆分,也都要计入答案。
所以第二组数据的答案是 3 + 2 = 5。
第三组数据中, S[1,8] 和 S[4,11] 各有 2 种优秀的拆分,其中 S[1,8] 是 问题描述中的例子,所以答案是 2 + 2 = 4。
第四组数据中, S[1,4], S[6,11], S[7,12], S[2,11], S[1,8] 各有 1 种优秀 的拆分, S[3,14] 有 2 种优秀的拆分,所以答案是 5 + 2 = 7。
【样例 2 输入输出】
见目录下的 excellent/excellent2.in 与 excellent/excellent2.ans。
【样例 3 输入输出】
见目录下的 excellent/excellent3.in 与 excellent/excellent3.ans。
对于全部的测试点,保证 1 ≤ T ≤ 10。 以下对数据的限制均是对于单组输入数据而言的,也就是说同一个测试点下的 T 组数据均满足限制条件。
我们假定 n 为字符串 S 的长度,每个测试点的详细数据范围见下表:
NOI2016 Day1 T1
这道题有点难想到正解。
枚举长度i,然后把字符串拆分成许多连续的长度为i的子串,通过比较LCS与LCP得出一段的答案,这里发现答案是区间加法,考虑用线段树很可能超时,这里用的是差分,看程序很好理解。还有一个地方要注意:更新答案时可能会重复计算,只需要确保每次枚举都只在一段限定的区间更新,就不会出现重叠。
1 #include <iostream> 2 #include <cstring> 3 #include <cstdio> 4 using namespace std; 5 const int N=120010; 6 struct SAM{ 7 char s[N]; 8 int fa[N],pos[N],sa[N],rank[N]; 9 int son[N][26],end[N],rht[N],lcp[N]; 10 int ch[N][26],len[N],id[N],tot; 11 int od[N],wv[N],lst,cnt; 12 int mm[N],Min[N][25]; 13 void Init(){ 14 memset(s,0,sizeof(s)); 15 memset(ch,0,sizeof(ch)); 16 memset(end,0,sizeof(end)); 17 memset(son,0,sizeof(son)); 18 memset(pos,0,sizeof(pos)); 19 lst=cnt=1;tot=0; 20 } 21 22 void Insert(int c){ 23 int p=lst,np=lst=++cnt;end[lst]=1; 24 id[len[np]=len[p]+1]=np;rht[np]=1; 25 while(p&&!ch[p][c])ch[p][c]=np,p=fa[p]; 26 if(!p)fa[np]=1; 27 else{ 28 int q=ch[p][c],nq; 29 if(len[q]==len[p]+1)fa[np]=q; 30 else{ 31 len[nq=++cnt]=len[p]+1; 32 fa[nq]=fa[q];fa[q]=fa[np]=nq; 33 memcpy(ch[nq],ch[q],sizeof(ch[q])); 34 while(ch[p][c]==q)ch[p][c]=nq,p=fa[p]; 35 } 36 } 37 } 38 39 void Get_Right(){ 40 for(int i=1;i<=cnt;i++)wv[len[i]]++; 41 for(int i=1;i<=cnt;i++)wv[i]+=wv[i-1]; 42 for(int i=1;i<=cnt;i++)od[wv[len[i]]--]=i; 43 for(int i=cnt;i>=1;i--)rht[fa[od[i]]]+=rht[od[i]]; 44 } 45 46 void Build_Tree(){ 47 int l=strlen(s+1); 48 for(int i=l;i>=1;i--)Insert(s[i]-‘a‘); 49 for(int i=l;i>=1;i--) 50 for(int x=id[i],p=l+1;x&&!pos[x];x=fa[x]) 51 p-=len[x]-len[fa[x]],pos[x]=p; 52 for(int x=2;x<=cnt;x++)son[fa[x]][s[pos[x]]-‘a‘]=x; 53 } 54 55 void DFS(int x,int l){ 56 if(end[x])sa[rank[l-len[x]+1]=++tot]=l-len[x]+1; 57 for(int i=0;i<26;i++)if(son[x][i])DFS(son[x][i],l); 58 } 59 60 void Build_SA(){ 61 int l=strlen(s+1),k=0;DFS(1,l); 62 for(int i=1,j;i<=l;lcp[rank[i++]]=k) 63 for(k?k--:k,j=sa[rank[i]-1];s[i+k]==s[j+k];k++); 64 mm[0]=-1; 65 for(int i=1;i<=l;i++){ 66 mm[i]=(i&(i-1))?mm[i-1]:mm[i-1]+1; 67 Min[i][0]=lcp[i]; 68 } 69 for(int k=1;k<=mm[l];k++) 70 for(int i=1;i+(1<<k-1)<=l;i++) 71 Min[i][k]=min(Min[i][k-1],Min[i+(1<<(k-1))][k-1]); 72 } 73 74 int LCP(int x,int y){ 75 if(x>y)swap(x,y);x+=1;int k=mm[y-x+1]; 76 int ret=min(Min[x][k],Min[y-(1<<k)+1][k]); 77 return ret; 78 } 79 }A,B; 80 81 int ln,T,f[N],g[N];char s[N]; 82 int Get_LCP(int x,int y){return A.LCP(A.rank[x],A.rank[y]);} 83 int Get_LCS(int x,int y){return B.LCP(B.rank[ln-x+1],B.rank[ln-y+1]);} 84 85 int main(){ 86 freopen("excellent.in","r",stdin); 87 freopen("excellent.out","w",stdout); 88 scanf("%d",&T); 89 while(T--){ 90 A.Init();B.Init(); 91 scanf("%s",s+1);ln=strlen(s+1); 92 for(int i=1;i<=ln;i++){A.s[i]=s[i];B.s[i]=s[ln-i+1];} 93 A.Build_Tree();A.Build_SA(); 94 B.Build_Tree();B.Build_SA(); 95 for(int i=1;i<=ln;i++)f[i]=g[i]=0; 96 97 for(int i=1,l,r,x;i+i<=ln;i++) 98 for(int j=i;(x=j+i)<=ln;j+=i)if(s[j]==s[x]){ 99 l=x-Get_LCS(j,x)+1;r=x+Get_LCP(j,x)-1; 100 l=max(l+i-1,x);r=min(r,x+i-1); 101 if(l>r)continue; 102 f[l]++,f[r+1]--; 103 g[l-i-i+1]++,g[r+1-i-i+1]--; 104 } 105 long long ans=0; 106 for(int i=1;i<=ln;i++)f[i]+=f[i-1],g[i]+=g[i-1]; 107 for(int i=1;i<ln;i++)ans+=f[i]*g[i+1]; 108 printf("%lld\n",ans); 109 } 110 return 0; 111 }
标签:
原文地址:http://www.cnblogs.com/TenderRun/p/5761718.html