题目:求一个字符串中所有不同子串个数
后缀数组经典题,每一个子串一定是某个后缀的前缀,那么问题便等价于求所有后缀之间的不相同的前缀个数。我们按sa的顺序来考虑,当加入sa[k]的时候,sa[k]这个后缀的长度为n-sa[k]-1,那么便有n-sa[k]-1个前缀,但是由heigh数组可知sa[k]与sa[k-1]有height[k]个前缀是相同的,所以要除去。
注意的是这道题题意有点坑,一开始以为字母只能是大写的而且长度在1000之内,可发现根本不是这样!!!!!!!!最后改了m的值又把数组开到了50000才ac。
#include<cstdio> #include<cstring> #include<cmath> #include<cstdlib> #include<iostream> #include<algorithm> #include<vector> #include<map> #include<queue> #include<stack> #include<string> #include<map> #include<set> #define eps 1e-6 #define LL long long using namespace std; const int maxn = 50005; //const int INF = 0x3f3f3f3f; char str[maxn]; struct SuffixArray { int s[maxn]; /// 原始字符数组(最后一个字符应必须是0,而前面的字符必须非0) int sa[maxn]; // 后缀数组,sa[0]一定是n-1,即最后一个字符 int rank[maxn]; // 名次数组 int height[maxn]; // height数组 int t[maxn], t2[maxn], c[maxn]; // 辅助数组 int n; // 字符个数 void clear() { n = 0; memset(sa, 0, sizeof(sa)); } /// m为最大字符值加1。!!! 调用之前需设置好s和n void build_sa(int m) { int i, *x = t, *y = t2; for(i = 0; i < m; i++) c[i] = 0; for(i = 0; i < n; i++) c[x[i] = s[i]]++; for(i = 1; i < m; i++) c[i] += c[i-1]; for(i = n-1; i >= 0; i--) sa[--c[x[i]]] = i; for(int k = 1; k <= n; k <<= 1) { int p = 0; for(i = n-k; i < n; i++) y[p++] = i; for(i = 0; i < n; i++) if(sa[i] >= k) y[p++] = sa[i]-k; for(i = 0; i < m; i++) c[i] = 0; for(i = 0; i < n; i++) c[x[y[i]]]++; for(i = 0; i < m; i++) c[i] += c[i-1]; for(i = n-1; i >= 0; i--) sa[--c[x[y[i]]]] = y[i]; swap(x, y); p = 1; x[sa[0]] = 0; for(i = 1; i < n; i++) x[sa[i]] = y[sa[i-1]]==y[sa[i]] && y[sa[i-1]+k]==y[sa[i]+k] ? p-1 : p++; if(p >= n) break; m = p; } } void build_height() { int i, j, k = 0; for(i = 0; i < n; i++) rank[sa[i]] = i; for(i = 0; i < n; i++) { if(k) k--; j = sa[rank[i]-1]; while(s[i+k] == s[j+k]) k++; height[rank[i]] = k; } } } sa; void init() { sa.clear(); cin >> str; int len = strlen(str); for(int i = 0; i < len; i++) sa.s[i] = str[i] - 'A' + 1; sa.s[len] = 0; sa.n = len + 1; } void solve() { sa.build_sa(300); sa.build_height(); int ans = sa.n - sa.sa[1] - 1; for(int i = 2; i < sa.n; i++) ans += sa.n - 1 - sa.sa[i] - sa.height[i]; cout << ans << endl; } int main() { //freopen("input.txt", "r", stdin); int t; cin >> t; while(t--) { init(); solve(); } return 0; }
版权声明:本文为博主原创文章,未经博主允许不得转载。
spoj 694 Distinct Substrings(后缀数组)
原文地址:http://blog.csdn.net/u014664226/article/details/46915603