码迷,mamicode.com
首页 > 编程语言 > 详细

[spoj694&spoj705]New Distinct Substrings(后缀数组)

时间:2017-09-22 22:39:51      阅读:228      评论:0      收藏:0      [点我收藏+]

标签:iostream   组合   答案   std   字符串   为什么   using   names   height   

题意:求字符串中不同子串的个数。

解题关键:每个子串一定是某个后缀的前缀,那么原问题等价于求所有后缀之间的不相同的前缀的个数。

1、总数减去height数组的和即可。

注意这里height中为什么不需要进行组合计数,因为,每一个height的左端点已经确定,所以只需变动右端点,总共$height[i]$种情况。

2、如果所有的后缀按照 suffix(sa[1]), suffix(sa[2]),suffix(sa[3]), …… ,suffix(sa[n])的顺序计算,不难发现,对于每一次新加进来的后缀 suffix(sa[k]),它将产生 n-sa[k]+1 个新的前缀。但是其中有height[k]个是和前面的字符串的前缀是相同的。所以 suffix(sa[k])将“贡献”出 n-sa[k]+1- height[k]个不同的子串。累加后便是原问题的答案。这个做法的时间复杂度为 O(n)。

 1 #include <cstdlib>
 2 #include <cstring>
 3 #include <cstdio>
 4 #include <algorithm>
 5 #include<iostream>
 6 #include<cmath>
 7 #define inf 0x3f3f3f3f
 8 typedef long long ll;
 9 using namespace std;
10 const int N=200005;
11 int wa[N],wb[N],wv[N],wc[N];
12 bool cmp(int *r,int a,int b,int l){return r[a]==r[b]&&r[a+l]==r[b+l];}
13 void make_sa(int *r,int *sa,int n,int m){
14     int i,j,p,*x=wa,*y=wb;
15     for(i=0;i<m;i++) wc[i]=0;
16     for(i=0;i<n;i++) wc[x[i]=r[i]]++;
17     for(i=1;i<m;i++) wc[i]+=wc[i-1];
18     for(i=n-1;i>=0;i--) sa[--wc[x[i]]]=i;
19     for(j=1,p=1;p<n;j*=2,m=p){
20         for(p=0,i=n-j;i<n;i++) y[p++]=i;
21         for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j;
22         for(i=0;i<n;i++) wv[i]=x[y[i]];
23         for(i=0;i<m;i++) wc[i]=0;
24         for(i=0;i<n;i++) wc[wv[i]]++;
25         for(i=1;i<m;i++) wc[i]+=wc[i-1];
26         for(i=n-1;i>=0;i--) sa[--wc[wv[i]]]=y[i];
27         for(swap(x,y),p=1,x[sa[0]]=0,i=1;i<n;i++) x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
28     }
29     return;
30 }
31 int rank1[N],height[N],sa[N];
32 void make_height(int *r,int *sa,int n){
33     int i,j,k=0;
34     for(i=1;i<=n;i++) rank1[sa[i]]=i;
35     for(i=0;i<n;height[rank1[i++]]=k)
36         for(k?k--:0,j=sa[rank1[i]-1];r[i+k]==r[j+k];k++);
37     return;
38 }
39 
40 int n,k,r[N]; 
41 int main(){
42     int t;
43     ios::sync_with_stdio(0);
44     cin>>t;
45     while(t--){
46         string s;
47         cin>>s;
48         for(int i=0;i<s.size();i++) r[i]=(int)s[i];
49         r[s.size()]=0;
50         n=s.size();
51         make_sa(r,sa,n+1,129);
52         make_height(r,sa,n);
53         ll sum=s.size()*(s.size()+1)/2;
54         for(int i=2;i<=n;i++){
55             sum-=height[i];
56         }
57         cout<<sum<<"\n";
58     }
59     return 0;
60 }

 

[spoj694&spoj705]New Distinct Substrings(后缀数组)

标签:iostream   组合   答案   std   字符串   为什么   using   names   height   

原文地址:http://www.cnblogs.com/elpsycongroo/p/7577029.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!