码迷,mamicode.com
首页 > 编程语言 > 详细

bzoj 2251: [2010Beijing Wc]外星联络 后缀数组

时间:2015-03-21 22:47:46      阅读:271      评论:0      收藏:0      [点我收藏+]

标签:

2251: [2010Beijing Wc]外星联络

Time Limit: 30 Sec  Memory Limit: 256 MB
Submit: 424  Solved: 232
[Submit][Status][Discuss]

Description

小 P 在看过电影《超时空接触》(Contact)之后被深深的打动,决心致力于寻
找外星人的事业。于是,他每天晚上都爬在屋顶上试图用自己的收音机收听外星
人发来的信息。虽然他收听到的仅仅是一些噪声,但是他还是按照这些噪声的高
低电平将接收到的信号改写为由 0 和 1 构成的串, 并坚信外星人的信息就隐藏在
其中。他认为,外星人发来的信息一定会在他接受到的 01 串中重复出现,所以
他希望找到他接受到的 01 串中所有重复出现次数大于 1 的子串。但是他收到的
信号串实在是太长了,于是,他希望你能编一个程序来帮助他。

Input

输入文件的第一行是一个整数N ,代表小 P 接收到的信号串的长度。
输入文件第二行包含一个长度为N 的 01 串,代表小 P 接收到的信号串。

Output

输出文件的每一行包含一个出现次数大于1 的子串所出现的次数。输出的顺
序按对应的子串的字典序排列。

Sample Input

7
1010101

Sample Output

3
3
2
2
4
3
3
2
2

HINT

  对于 100%的数据,满足 0 <=? ? N     <=3000

 

  按理说以前写过的算法模板题就不该再写了,但是我后缀数组掌握的确实跟xiang一样,还是再写一遍。

  后缀数组需要将内存开大两倍,这个问题我就不赘述了。主要问题是求height数组,以前总觉得顺序问题很烦,其实也不难,只要搞清楚求height的转移顺序就行,一个位置的height求取就需要它在“字符串位置”中前一个位置的height值就行了,所以for语句应该一次枚举原数组的位置。

  剩下就比较简单了,我用O(n^2)的时间复杂度处理答案,不知道有没有更快的,一点小的注意事项,字典序排序注意起始位置相同的子串的顺序,其顺序与枚举顺序相反。也就是说我们在绕过一个坑的情况下防止跌进另一个坑中。

  最后hbw提到一个将随机字符串后缀数组优化到O(n)的方法,当rank数组最大值为n时直接break掉,貌似这是个简单有用的优化

#include<iostream>
#include<cstdio>
#include<cstring>
#include<algorithm>
#include<vector>
using namespace std;
#define MAXN 3010*2
char str[MAXN];
int sa[MAXN],tsa[MAXN];
int rank[MAXN],trank[MAXN];
int buc[MAXN];
int height[MAXN];
int theight[MAXN];
void IndexSort(int jp,int n)
{
        memset(buc,0,sizeof(buc));
        for (int i=0;i<n;i++)buc[rank[i+jp]]++;
        for (int i=1;i<=n;i++)buc[i]+=buc[i-1];
        for (int i=n-1;i>=0;i--)tsa[--buc[rank[i+jp]]]=i;
        memset(buc,0,sizeof(buc));
        for (int i=0;i<n;i++)buc[rank[tsa[i]]]++;
        for (int i=1;i<=n;i++)buc[i]+=buc[i-1];
        for (int i=n-1;i>=0;i--)sa[--buc[rank[tsa[i]]]]=tsa[i];
}
void SuffixArray(char* str,int n)
{
        for (int i=0;i<n;i++)trank[i]=str[i]-0+1;
        for (int i=0;i<n;i++)buc[trank[i]]++;
        for (int i=1;i<=n;i++)buc[i]+=buc[i-1];
        for (int i=n-1;i>=0;i--)sa[--buc[trank[i]]]=i;
        for (int i=0,x=0;i<n;i++)
        {
                if (!i || trank[sa[i]]!=trank[sa[i-1]])x++;
                rank[sa[i]]=x;
        }
        for (int j=1;j<n;j=j<<1)
        {
                IndexSort(j,n);
                int x=0;
                for (int i=0;i<n;i++)
                {
                        if (!i || rank[sa[i]]!=rank[sa[i-1]] || rank[sa[i]+j]!=rank[sa[i-1]+j])x++;
                        trank[sa[i]]=x;
                }
                for (int i=0;i<n;i++)rank[i]=trank[i];
                if (x==n)break;
        }
}
void InitHeight(int n)
{
        for (int i=0;i<n;i++)
        {
                if (rank[i]==1)continue;
                height[i]=max(height[i-1]-1,0);
                while (i+height[i]<n && sa[rank[i]-2]+height[i]<n 
                                && str[i+height[i]]==str[sa[rank[i]-2]+height[i]])
                        height[i]++;
        }
        for (int i=1;i<n;i++)
                theight[i]=height[sa[i]];
}
vector<int> vec;
int stack[MAXN],tops=-1;
int main()
{
        freopen("input.txt","r",stdin);
        int n;
        int x;
        scanf("%d\n",&n);
        scanf("%s\n",str);
        SuffixArray(str,n);
        InitHeight(n);
    //    for (int i=0;i<n;i++)printf("%d ",sa[i]);printf("\n");
    //    for (int i=0;i<n;i++)printf("%s\n",str+sa[i]);printf("\n");
    //    for (int i=0;i<n;i++)printf("%d ",height[i]);printf("\n");
        for (int i=1;i<n;i++)
        {
                if (theight[i]<=theight[i-1])continue;
                x=i;
                for (int k=theight[i];k>theight[i-1];k--)
                {
                        while (x+1<n && theight[x+1]>=k)x++;
                        stack[++tops]=x-i+2;
                }
                while (~tops)
                        printf("%d\n",stack[tops--]);
        }
}

 

bzoj 2251: [2010Beijing Wc]外星联络 后缀数组

标签:

原文地址:http://www.cnblogs.com/mhy12345/p/4356322.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!