码迷,mamicode.com
首页 > 编程语言 > 详细

spoj 694 Distinct Substrings(后缀数组)

时间:2015-07-16 22:27:50      阅读:136      评论:0      收藏:0      [点我收藏+]

标签:spoj   后缀数组   

题目:求一个字符串中所有不同子串个数

后缀数组经典题,每一个子串一定是某个后缀的前缀,那么问题便等价于求所有后缀之间的不相同的前缀个数。我们按sa的顺序来考虑,当加入sa[k]的时候,sa[k]这个后缀的长度为n-sa[k]-1,那么便有n-sa[k]-1个前缀,但是由heigh数组可知sa[k]与sa[k-1]有height[k]个前缀是相同的,所以要除去。

注意的是这道题题意有点坑,一开始以为字母只能是大写的而且长度在1000之内,可发现根本不是这样!!!!!!!!最后改了m的值又把数组开到了50000才ac。

#include<cstdio>  
#include<cstring>  
#include<cmath>  
#include<cstdlib>  
#include<iostream>  
#include<algorithm>  
#include<vector>  
#include<map>  
#include<queue>  
#include<stack> 
#include<string>
#include<map> 
#include<set>
#define eps 1e-6 
#define LL long long  
using namespace std;  

const int maxn = 50005;
//const int INF = 0x3f3f3f3f;
char str[maxn];

struct SuffixArray {  
	
    int s[maxn];      /// 原始字符数组(最后一个字符应必须是0,而前面的字符必须非0)  
    int sa[maxn];     // 后缀数组,sa[0]一定是n-1,即最后一个字符  
    int rank[maxn];   // 名次数组  
    int height[maxn]; // height数组  
    int t[maxn], t2[maxn], c[maxn]; // 辅助数组  
    int n; // 字符个数  
  
    void clear() { n = 0; memset(sa, 0, sizeof(sa)); }  
  
    /// m为最大字符值加1。!!! 调用之前需设置好s和n  
    void build_sa(int m) {  
 	   int i, *x = t, *y = t2;  
    	for(i = 0; i < m; i++) c[i] = 0;  
	    for(i = 0; i < n; i++) c[x[i] = s[i]]++;  
    	for(i = 1; i < m; i++) c[i] += c[i-1];  
	    for(i = n-1; i >= 0; i--) sa[--c[x[i]]] = i;  
    	for(int k = 1; k <= n; k <<= 1) {  
      		int p = 0;  
      		for(i = n-k; i < n; i++) y[p++] = i;  
      		for(i = 0; i < n; i++) if(sa[i] >= k) y[p++] = sa[i]-k;  
      		for(i = 0; i < m; i++) c[i] = 0;  
      		for(i = 0; i < n; i++) c[x[y[i]]]++;  
      		for(i = 0; i < m; i++) c[i] += c[i-1];  
      		for(i = n-1; i >= 0; i--) sa[--c[x[y[i]]]] = y[i];  
      		swap(x, y);  
      		p = 1; x[sa[0]] = 0;  
      		for(i = 1; i < n; i++)  
      			x[sa[i]] = y[sa[i-1]]==y[sa[i]] && y[sa[i-1]+k]==y[sa[i]+k] ? p-1 : p++;  
      		if(p >= n) break;  
      		m = p;  
    	}  
  	}  
  
    void build_height() {  
    	int i, j, k = 0;  
    	for(i = 0; i < n; i++) rank[sa[i]] = i;  
    	for(i = 0; i < n; i++) {  
        	if(k) k--;  
      		j = sa[rank[i]-1];  
      		while(s[i+k] == s[j+k]) k++;  
      		height[rank[i]] = k;  
    	}  
  	}  
} sa;

void init() {
	sa.clear();
	cin >> str;
	int len = strlen(str);
	for(int i = 0; i < len; i++) sa.s[i] = str[i] - 'A' + 1;
	sa.s[len] = 0;
	sa.n = len + 1; 
}

void solve() {
	sa.build_sa(300);
	sa.build_height();
	int ans = sa.n - sa.sa[1] - 1;
	for(int i = 2; i < sa.n; i++) ans += sa.n - 1 - sa.sa[i] - sa.height[i];
	cout << ans << endl;
}

int main() {
	//freopen("input.txt", "r", stdin);
	int t; cin >> t;
	while(t--) {
		init();
		solve();
	} 
	return 0;
}








版权声明:本文为博主原创文章,未经博主允许不得转载。

spoj 694 Distinct Substrings(后缀数组)

标签:spoj   后缀数组   

原文地址:http://blog.csdn.net/u014664226/article/details/46915603

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!