题目链接
Description
一个长度为\(n\)的字符串\(S\),令\(T_i\)表示它从第\(i\)个字符开始的后缀。求\[\sum_{1\leq i\leq j\leq n}len(T_i)+len(T_j)-2*lcp(T_i,T_j)\]其中,\(len(a)\)表示字符串\(a\)的长度,\(lcp(a,b)\)表示字符串\(a\)和字符串\(b\)的最长公共前缀。
\(2\leq n\leq 500000\)
思路
\(O(n^2)\)枚举显然是不可行的,应从 贡献 的角度取思考问题。
首先,每个后缀都被计算 \(n-1\) 次,如果不减去\(lcp\)的话,则答案为\[(1+2+...+n)*(n-1)=\frac{(n+1)*n*(n-1)}{2}\]
再来考虑\(lcp\),因为任意两个后缀的\(lcp\)的长度即为\(height\)数组的区间最小值,所以要减去的即为 所有区间的最小值之和。
即考虑每个点向左向右可以延伸多远,所有区间最小值之和即为
\[\sum_{i=1}^{n}(r[i]-i+1)*(i-l[i]+1)*h[i]\]
// 注意,区间个数要用乘法原则。
\(l\)与\(r\)数组的计算用 单调栈 即可,如poj 2796 Feel Good.
Code
#include <bits/stdc++.h>
#define maxn 500010
using namespace std;
typedef long long LL;
int wa[maxn], wb[maxn], wv[maxn], wt[maxn], h[maxn], rk[maxn], sa[maxn], n, r[maxn], l[maxn], st[maxn];
char s[maxn];
bool cmp(int* r, int a, int b, int l) { return r[a] == r[b] && r[a+l] == r[b+l]; }
void init(int* r, int* sa, int n, int m) {
int* x=wa, *y=wb, *t, i, j, p;
for (i = 0; i < m; ++i) wt[i] = 0;
for (i = 0; i < n; ++i) ++wt[x[i] = r[i]];
for (i = 1; i < m; ++i) wt[i] += wt[i - 1];
for (i = n-1; i >= 0; --i) sa[--wt[x[i]]] = i;
for (j = 1, p = 1; p < n; j <<= 1, m = p) {
for (p = 0, i = n-j; i < n; ++i) y[p++] = i;
for (i = 0; i < n; ++i) if (sa[i] >= j) y[p++] = sa[i] - j;
for (i = 0; i < n; ++i) wv[i] = x[y[i]];
for (i = 0; i < m; ++i) wt[i] = 0;
for (i = 0; i < n; ++i) ++wt[wv[i]];
for (i = 1; i < m; ++i) wt[i] += wt[i - 1];
for (i = n-1; i >= 0; --i) sa[--wt[wv[i]]] = y[i];
t = x, x = y, y = t, x[sa[0]] = 0;
for (p = 1, i = 1; i < n; ++i) x[sa[i]] = cmp(y, sa[i], sa[i-1], j) ? p - 1 : p++;
}
for (i = 0; i < n; ++i) rk[sa[i]] = i;
int k = 0;
for (i = 0; i < n - 1; h[rk[i++]] = k) {
for (k = k ? --k : 0, j = sa[rk[i] - 1]; r[i+k] == r[j+k]; ++k);
}
}
int main() {
scanf("%s", s);
int tot=0, m=0, len=strlen(s);
for (int i = 0; i < len; ++i) m = max(r[tot++] = s[i], m); r[tot++] = 0;
init(r, sa, tot, ++m);
int top=0;
LL ans = 1LL * (len+1) * len / 2 * (len-1);
h[tot] = -1;
for (int i = 2; i <= tot; ++i) {
int ll = i;
while (top && h[i]<h[st[top-1]]) {
--top;
ans -= 1LL * h[st[top]] * (i-st[top]) * (st[top]-(ll=l[st[top]])+1) * 2;
}
st[top++] = i; l[i] = ll;
}
printf("%lld\n", ans);
return 0;
}