码迷,mamicode.com
首页 > 编程语言 > 详细

URAL 1297 后缀数组:求最长回文子串

时间:2015-03-12 15:00:22      阅读:261      评论:0      收藏:0      [点我收藏+]

标签:

思路:这题下午搞了然后一直WA,后面就看了Discuss,里面有个数组:ABCDEFDCBA,这个我输出ABCD,所以错了。

然后才知道自己写的后缀数组对这个回文子串有bug,然后就不知道怎么改了。

然后看题解,里面都是用RMQ先预处理随意两个后缀的最长公共前缀,由于不太知道这个,所以又看了一下午,嘛嘛……

然后理解RMQ和后缀一起用的时候才发现事实上这里不用RMQ也能够,仅仅要特殊处理一下上面这个没过的样例即可了,哈哈……机智……

解法一:

这个是不用RMQ做的:

#include<iostream>
#include<cstdio>
#include<cstring>
#include<algorithm>
#include<map>
#include<queue>
#include<set>
#include<cmath>
#include<bitset>
#define mem(a,b) memset(a,b,sizeof(a))
#define lson i<<1,l,mid
#define rson i<<1|1,mid+1,r
#define llson j<<1,l,mid
#define rrson j<<1|1,mid+1,r
#define INF 0x7fffffff
#define maxn 4010
using namespace std;
typedef long long ll;
typedef unsigned long long ull;
void radix(int *str,int *a,int *b,int n,int m)
{
    static int count[maxn];
    mem(count,0);
    for(int i=0; i<n; i++) ++count[str[a[i]]];
    for(int i=1; i<=m; i++) count[i]+=count[i-1];
    for(int i=n-1; i>=0; i--) b[--count[str[a[i]]]]=a[i];
}
void suffix(int *str,int *sa,int n,int m) 
{
    static int rank[maxn],a[maxn],b[maxn];
    for(int i=0; i<n; i++) rank[i]=i;
    radix(str,rank,sa,n,m);
    rank[sa[0]]=0;
    for(int i=1; i<n; i++)
        rank[sa[i]]=rank[sa[i-1]]+(str[sa[i]]!=str[sa[i-1]]);
    for(int i=0; 1<<i<n; i++)
    {
        for(int j=0; j<n; j++)
        {
            a[j]=rank[j]+1;
            b[j]=j+(1<<i)>=n?0:rank[j+(1<<i)]+1;
            sa[j]=j;
        }
        radix(b,sa,rank,n,n);
        radix(a,rank,sa,n,n);
        rank[sa[0]]=0;
        for(int j=1; j<n; j++)
            rank[sa[j]]=rank[sa[j-1]]+(a[sa[j-1]]!=a[sa[j]]||b[sa[j-1]]!=b[sa[j]]);
    }
}
void calcHeight(int *str,int *sa,int *h,int n) 
{
    static int rank[maxn];
    int k=0;
    h[0]=0;
    for(int i=0; i<n; i++) rank[sa[i]]=i;
    for(int i=0; i<n; i++)
    {
        k=k==0?0:k-1;
        if(rank[i])
            while(str[i+k]==str[sa[rank[i]-1]+k]) k++;
        else k=0;
        h[rank[i]]=k;
    }
}
int a[maxn],sa[maxn],height[maxn];
int main()
{
    string s;
    while(cin>>s)
    {
        string str;
        for(int i=s.size()-1; i>=0; i--)
            str+=s[i];
        str=s+"#"+str;
        copy(str.begin(),str.end(),a);
        int n=str.size();
        suffix(a,sa,n,n+256);
        calcHeight(a,sa,height,n);
        int len=0,pos=1;
        for(int i=1; i<n; i++)
            if(sa[i]+sa[i-1]==n-height[i]&&((sa[i]<s.size())!=(sa[i-1]<s.size())))
            {
                if(height[i]>len)
                {
                    len=height[i];
                    pos=min(sa[i],sa[i-1]);
                }
                else if(height[i]==len)
                    pos=min(pos,min(sa[i],sa[i-1]));
            }
        if(len>1) cout<<str.substr(pos,len)<<endl;
        else cout<<s[0]<<endl;
    }
    return 0;
}
/*
ABCDDCBAEFDCBA
ABCDEFDCBA  //要是没有sa[i]+sa[i-1]==n-height[i]这个样例会输出ABCD
ABCDDBCA
AAAAA
AAAA
A
*/

解法二:

这个是用RMQ的,我是弄懂了RMQ和height数组联合使用来处理问题了之后我才写,本来開始就写对了,可是刚開始处理的那个字符错了,然后调试了好久才好。

对字符串奇偶性作推断,由于……这个自己写个串出来自己判定一下就明确了,论文里面也说得挺清楚的了。

另外为什么要奇偶推断,是由于要推断字符与其对称的字符是不是一样,不然的话这个例子就过不了:ABCEFCBA

#include<iostream>
#include<cstdio>
#include<cstring>
#include<algorithm>
#include<map>
#include<queue>
#include<set>
#include<cmath>
#include<bitset>
#define mem(a,b) memset(a,b,sizeof(a))
#define lson i<<1,l,mid
#define rson i<<1|1,mid+1,r
#define llson j<<1,l,mid
#define rrson j<<1|1,mid+1,r
#define INF 0x7fffffff
#define maxn 2010
using namespace std;
typedef long long ll;
typedef unsigned long long ull;
void radix(int *str,int *a,int *b,int n,int m)
{
    static int count[maxn];
    mem(count,0);
    for(int i=0; i<n; i++) ++count[str[a[i]]];
    for(int i=1; i<=m; i++) count[i]+=count[i-1];
    for(int i=n-1; i>=0; i--) b[--count[str[a[i]]]]=a[i];
}
void suffix(int *str,int *sa,int n,int m) //倍增算法计算出后缀数组sa
{
    static int rank[maxn],a[maxn],b[maxn];
    for(int i=0; i<n; i++) rank[i]=i;
    radix(str,rank,sa,n,m);
    rank[sa[0]]=0;
    for(int i=1; i<n; i++)
        rank[sa[i]]=rank[sa[i-1]]+(str[sa[i]]!=str[sa[i-1]]);
    for(int i=0; 1<<i<n; i++)
    {
        for(int j=0; j<n; j++)
        {
            a[j]=rank[j]+1;
            b[j]=j+(1<<i)>=n?0:rank[j+(1<<i)]+1;
            sa[j]=j;
        }
        radix(b,sa,rank,n,n);
        radix(a,rank,sa,n,n);
        rank[sa[0]]=0;
        for(int j=1; j<n; j++)
            rank[sa[j]]=rank[sa[j-1]]+(a[sa[j-1]]!=a[sa[j]]||b[sa[j-1]]!=b[sa[j]]);
    }
}
void calcHeight(int *str,int *sa,int *h,int *rank,int n) //求出最长公共前缀数组h
{
    int k=0;
    h[0]=0;
    for(int i=0; i<n; i++) rank[sa[i]]=i;
    for(int i=0; i<n; i++)
    {
        k=k==0?0:k-1;
        if(rank[i])
            while(str[i+k]==str[sa[rank[i]-1]+k]) k++;
        else k=0;
        h[rank[i]]=k;
    }
}
int a[maxn],sa[maxn],height[maxn],rank[maxn];
char s[maxn];
int dp[maxn][40];
void RMQ_INIT(int n)
{
    mem(dp,0);
    for(int i=1; i<n; i++)
        dp[i][0]=height[i];
    for(int j=1; (1<<j)<=n; j++)
        for(int i=1; i+(1<<j)-1<n; i++)
            dp[i][j]=min(dp[i][j-1],dp[i+(1<<(j-1))][j-1]);
}
int RMQ(int l,int r)
{
    l=rank[l],r=rank[r];
    if(l>r) swap(l,r);
    l++; //为什么要加1呢,由于l是与l+1位置求的最长公共前缀
    //即height[l+1]=suffix(l+1)与suffix(l)的最长公共前缀
    int k=log(r-l+1.0)/log(2.0);
    return min(dp[l][k],dp[r-(1<<k)+1][k]);
}
int main()
{
    //freopen("1.txt","r",stdin);
    while(~scanf("%s",s))
    {
        int n=strlen(s),i;
        for(i=0,s[n]='#'; i<n; i++)
            s[i+n+1]=s[n-i-1];
        n=n*2+1;
        s[n]='\0';
        mem(a,0);mem(height,0);
        mem(rank,0);mem(sa,0);
        copy(s,s+n,a);
        suffix(a,sa,n,256);
        calcHeight(a,sa,height,rank,n);
        RMQ_INIT(n);//预处理出字符串两个位置作后缀之前的最长公共前缀
        int sum=0,pos;
        for(i=0; i<n/2; i++)
        {
            int len=RMQ(i,n-i-1);//字符串长度为奇数
            if(len*2-1>sum) sum=len*2-1,pos=i-len+1;
            if(i)
            {
                len=RMQ(i,n-i);//字符串长度为偶数
                if(len*2>sum) sum=len*2,pos=i-len;
            }
        }
        for(i=pos; i<pos+sum; i++)
            printf("%c",s[i]);
        puts("");
    }
    return 0;
}



URAL 1297 后缀数组:求最长回文子串

标签:

原文地址:http://www.cnblogs.com/bhlsheji/p/4332301.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!