码迷,mamicode.com
首页 > 编程语言 > 详细

hdu 3518 Boring counting 后缀数组LCP

时间:2016-04-10 23:58:53      阅读:610      评论:0      收藏:0      [点我收藏+]

标签:

题目链接

题意:给定长度为n(n <= 1000)的只含小写字母的字符串,问字符串子串不重叠出现最少两次的不同子串个数;

input:

aaaa
ababcabb
aaaaaa
#
output
2
3
3
 
思路:套用后缀数组求解出sa数组和height数组,之后枚举后缀的公共前缀长度i,由于不能重叠,所以计数的是相邻height不满足LCP >= i的。
写写对后缀数组倍增算法的理解:
1.如果要sa数组对应的值也是1~n就需要在最后加上一个最小的且不出现的字符‘#‘,里面y[]是利用sa数组对第二个关键字重新排序,由于使用的是基数排序,所以当前一次长度为k时相同的子串,在下一次长为2*k时,y排在前面的下标得到的sa是要小的;
 
2.在getHeight函数中,rk[i]:后缀i在sa中的排名;height[i]表示s[i] 与s[i-1]的公共前缀长度。且s[i] 与 s[j] 的值为 RMQ(min{ height[i+1]...height[j] }),加上i < j;同时可以借助辅助数组h[i] = height[rk[i]],得到h[i] >= h[i-1] + 1;这样使用递推就可以将求解height[]的时间复杂度降为O(n);
 
注意:在输入串s末尾加入字符之后 n = strlen(s) + 1;在求解rk[]时,sa[i]是从1开始的,sa[0] = ‘$‘;之后的求解height[]还是从0开始;细节
 
#include<bits/stdc++.h>
using namespace std;
typedef long long ll;
const int MAXN = 1007;
char s[MAXN];
int sa[MAXN],t[MAXN],t2[MAXN],c[MAXN],n;
void build_sa(int m,int n) // m为字符ASCII码的最大值+1;n = strlen(s) + 1;
{
    int i,*x = t, *y = t2;
    for(i = 0;i < m; i++) c[i] = 0;
    for(i = 0;i < n; i++) c[x[i] = s[i]]++;
    for(i = 1;i < m; i++) c[i] += c[i-1];
    for(i = n - 1;i >= 0; i--) sa[--c[x[i]]] = i;
    for(int k = 1;k <= n;k <<= 1){
        int p = 0;
        for(i = n - k;i < n;i++) y[p++] = i;
        for(i = 0;i < n;i++) if(sa[i] >= k) y[p++] = sa[i] - k;

        for(i = 0;i < m;i++) c[i] = 0;
        for(i = 0;i < n;i++) c[x[y[i]]]++;
        for(i = 1;i < m;i++) c[i] += c[i-1];
        for(i = n - 1;i >= 0;i--) sa[--c[x[y[i]]]] = y[i];

        swap(x,y);
        x[sa[0]] = 0;// 将字符彻底转变为序号;
        for(i = 1,p = 1;i < n;i++)
            x[sa[i]] = y[sa[i]] == y[sa[i-1]] && y[sa[i]+k] == y[sa[i-1]+k]?p-1:p++;
        if(p >= n) break;
        m = p;
    }
}
int rk[MAXN],height[MAXN];
void getHeight()
{
    int i,j,k = 0;
    for(i = 1;i <= n;i++) rk[sa[i]] = i; // rk[i]:后缀i在sa[]中的下标,从1开始
    for(i = 0;i < n;i++){
        if(k) k--;
        if(rk[i] == 0) continue;
        j = sa[rk[i] - 1];
        while(i+k<n && j+k<n && s[i+k] == s[j+k]) k++;
        height[rk[i]] = k; // h[i] = height[rk[i]]; h[i] >= h[i-1] - 1;
    }
}
int main()
{
    while(scanf("%s",s) == 1 && s[0] != #){
        ll ans = 0;
        n = strlen(s);
        s[n] = #;
        build_sa(z+1,n+1);
        getHeight();
        for(int i = 1;i <= n/2; i++){
            int l = n+1,r = -1;
            for(int j = 2;j <= n;j++){
                if(height[j] >= i){// 递推出最左最优的l,r;
                    r = max(r,max(sa[j],sa[j-1]));
                    l = min(l,min(sa[j],sa[j-1]));
                }
                else{
                    if(r-l >= i) ans++;
                    r = -1,l = n+1;
                }
            }
            if(r-l >= i) ans++;
        }
        printf("%I64d\n",ans);
    }
    return 0;
}

 

 

 

hdu 3518 Boring counting 后缀数组LCP

标签:

原文地址:http://www.cnblogs.com/hxer/p/5376537.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!