码迷,mamicode.com
首页 > 编程语言 > 详细

后缀数组 POJ 1743 Musical Theme

时间:2016-05-01 09:47:11      阅读:171      评论:0      收藏:0      [点我收藏+]

标签:

 

题目链接

题意:给定n个数字,求超过5个数字的,最长的,变化相同的,不相交的重复子串

分析:男人8题中的一题!数列相邻两项做差,形成新数列,即求数列中的最长重复子串(不可相交)。

后缀数组+二分答案。假如二分得到答案L,如何知道它是可行的呢? 因为对于排序后的后缀,Lcp ( Suffix ( List [ i ] ) , Suffix ( List [ i - 1 ] ) ) 是所有与Suffix ( List [ i ] )的LCP值中最大的一个。 因为 Height [ i ] 表示的是排序后后缀数组中第i个后缀和第i-1个后缀的LCP值。 那么对于后缀数组中的一段 L - R , 若 Height [ L + 1 ] ~ Height [ R ] 全部大于等于L,那么就等价于第L到第R个后缀中任意两个后缀的LCP值都大于等于L。 那么只要取这里面相隔最远的两个后缀,若他们相距大于L,那么就是可行的。 ( 为什么不是等于L呢 ? 因为我们取的关键字是 S[i]-S[i-1] , 若相距等于L,那么两段里面的首尾相连了,是不符合条件的)

简单来说,先对height数组分段,然后看每段是否有满足题意的子串。

#include <cstdio>
#include <cstring>
#include <algorithm>

const int N = 2e4 + 5;
int sa[N], rank[N], height[N];
int t[N], t2[N], c[N];
int a[N];

void da(int *s, int n, int m = 128) {
    int i, p, *x = t, *y = t2;
    for (i=0; i<m; ++i) c[i] = 0;
    for (i=0; i<n; ++i) c[x[i]=s[i]]++;
    for (i=1; i<m; ++i) c[i] += c[i-1];
    for (i=n-1; i>=0; --i) sa[--c[x[i]]] = i;
    for (int k=1; k<=n; k<<=1) {
        for (p=0, i=n-k; i<n; ++i) y[p++] = i;
        for (i=0; i<n; ++i) if (sa[i] >= k) y[p++] = sa[i] - k;
        for (i=0; i<m; ++i) c[i] = 0;
        for (i=0; i<n; ++i) c[x[y[i]]]++;
        for (i=0; i<m; ++i) c[i] += c[i-1];
        for (i=n-1; i>=0; --i) sa[--c[x[y[i]]]] = y[i];
        std::swap (x, y);
        p = 1; x[sa[0]] = 0;
        for (i=1; i<n; ++i) {
            x[sa[i]] = (y[sa[i-1]]==y[sa[i]] && y[sa[i-1]+k]==y[sa[i]+k] ? p - 1 : p++);
        }
        if (p >= n) break;
        m = p;
    }
}

void calc_height(int n) {
    int i, k = 0;
    for (i=0; i<n; ++i) rank[sa[i]] = i;
    for (i=0; i<n; ++i) {
        if (k) k--;
        int j = sa[rank[i]-1];
        while (a[i+k] == a[j+k]) k++;
        height[rank[i]] = k;
    }
}

int n;

bool check(int m) {
    int mn = sa[0], mx = sa[0];
    for (int i=1; i<n; ++i) {
        if (height[i] >= m) {
            mn = std::min (mn, std::min (sa[i], sa[i-1]));
            mx = std::max (mx, std::max (sa[i], sa[i-1]));
            if (mn + m < mx) {
                return true;
            }
        } else {
            mn = mx = sa[i];
        }
    } 
    return false;
}

int main() {
    while (scanf ("%d", &n) == 1) {
        if (!n) break;
        for (int i=0; i<n; ++i) {
            scanf ("%d", a+i);
            if (i) a[i-1] = a[i] - a[i-1] + 100; //做差后有负数,+100保证为正数
        }
        
        if (n <= 10) {
            puts ("0");
            continue;
        }

        a[n-1] = 0;
        da (a, n, 200);
        calc_height (n);
        
        int ans = 0;
        int left = 0, right = n;
        while (left <= right) {
            int mid = left + right >> 1;
            if (check (mid)) {
                ans = std::max (ans, mid);
                left = mid + 1;
            } else {
                right = mid - 1;
            }
        }
        
        if (ans >= 4) {
            printf ("%d\n", ans + 1);
        } else {
            puts ("0");
        }
    }
    return 0;
}

  

后缀数组 POJ 1743 Musical Theme

标签:

原文地址:http://www.cnblogs.com/Running-Time/p/5450033.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!