@bzoj - 3670@ [Noi2014]动物园

时间：2019-11-12 21:55:54 阅读：85 评论：0 收藏：0 [点我收藏+]

@description@
@solution@
@accepted code@
@details@

@description@

近日，园长发现动物园中好吃懒做的动物越来越多了。例如企鹅，只会卖萌向游客要吃的。为了整治动物园的不良风气，让动物们凭自己的真才实学向游客要吃的，园长决定开设算法班，让动物们学习算法。

某天，园长给动物们讲解KMP算法。
园长：“对于一个字符串S，它的长度为L。我们可以在O(L)的时间内，求出一个名为next的数组。有谁预习了next数组的含义吗？”
熊猫：“对于字符串S的前i个字符构成的子串，既是它的后缀又是它的前缀的字符串中（它本身除外），最长的长度记作next[i]。”
园长：“非常好！那你能举个例子吗？”
熊猫：“例S为abcababc，则next[5]=2。因为S的前5个字符为abcab，ab既是它的后缀又是它的前缀，并且找不到一个更长的字符串满足这个性质。同理，还可得出next[1] = next[2] = next[3] = 0，next[4] = next[6] = 1，next[7] = 2，next[8] = 3。”
园长表扬了认真预习的熊猫同学。随后，他详细讲解了如何在O(L)的时间内求出next数组。

下课前，园长提出了一个问题：“KMP算法只能求出next数组。我现在希望求出一个更强大num数组一一对于字符串S的前i个字符构成的子串，既是它的后缀同时又是它的前缀，并且该后缀与该前缀不重叠，将这种字符串的数量记作num[i]。例如S为aaaaa，则num[4] = 2。这是因为S的前4个字符为aaaa，其中a和aa都满足性质‘既是后缀又是前缀’，同时保证这个后缀与这个前缀不重叠。而aaa虽然满足性质‘既是后缀又是前缀’，但遗憾的是这个后缀与这个前缀重叠了，所以不能计算在内。同理，num[1] = 0,num[2] = num[3] = 1,num[5] = 2。”

最后，园长给出了奖励条件，第一个做对的同学奖励巧克力一盒。听了这句话，睡了一节课的企鹅立刻就醒过来了！但企鹅并不会做这道题，于是向参观动物园的你寻求帮助。你能否帮助企鹅写一个程序求出num数组呢？
特别地，为了避免大量的输出，你不需要输出num[i]分别是多少，你只需要输出\(\prod_{i=1}^{L}(num[i]+1)\)对1,000,000,007取模的结果即可。

Input
第1行仅包含一个正整数n ，表示测试数据的组数。随后n行，每行描述一组测试数据。每组测试数据仅含有一个字符串S，S的定义详见题目描述。数据保证S 中仅含小写字母。输入文件中不会包含多余的空行，行末不会存在多余的空格。

Output
包含 n 行，每行描述一组测试数据的答案，答案的顺序应与输入数据的顺序保持一致。对于每组测试数据，仅需要输出一个整数，表示这组测试数据的答案对 1,000,000,007 取模的结果。输出文件中不应包含多余的空行。

Sample Input
3
aaaaa
ab
abcababc
Sample Output
36
1
32

HINT
n≤5,L≤1,000,000

@solution@

题面暗示题解.jpg。

可以以 border 的角度理解这个题，也可以以 border 的角度更好地理解 kmp 算法。
什么是 border？即字符串所有相同的前缀与后缀构成的集合，或者说 S[1...i] = S[lenS-i+1...lenS] 对应的 S[1...i]。
那么 kmp 所求的实际上就是前 i 个字符对应的最长 border 长度 next[i]。

注意到 next[i], next[next[i]], ... 实际上包含了前 i 个字符的所有 border 长度。
那么这道题就可以用倍增求出第一个长度 <= i/2 的 border 长度 fir[k]。
我们可以在 kmp 的时候递推出前缀 k 又有多少 border，记作 cnt[k]。对于 i 来说，num[i] = cnt[k] + 1（多一个 1 是因为 k 本身也是合法的）。

但是倍增是 log 的，而这道题显然卡 log 做法。
我们可以考虑类比 kmp 的求解方法，在求前缀 i 的时候充分利用前缀 i-1 的信息。
具体到这一道题，有 fir[i] <= fir[i-1] + 1
那么从 fir[i-1] 开始暴力跳 next 往回找第一个可以拼接出前缀 i 的 border 的位置，这个位置 + 1 就是我们要找的 fir[i]。
时间复杂度和 kmp 的证明方法一样。

@accepted code@

#include <cstdio>
#include <cstring>
const int MAXN = 1000000;
const int MOD = int(1E9) + 7;
int f1[MAXN + 5], f2[MAXN + 5];
int num[MAXN + 5], cnt[MAXN + 5];
char S[MAXN + 5];
void solve() {
    scanf("%s", S);
    int lenS = strlen(S);
    f1[0] = cnt[0] = -1, f1[1] = 0;
    for(int i=2;i<=lenS;i++) {
        int j = f1[i - 1];
        while( j != -1 && S[j] != S[i-1] )
            j = f1[j];
        f1[i] = j + 1, cnt[i] = cnt[f1[i]] + 1;
    }
    f2[0] = -1, f2[1] = 0;
    for(int i=2;i<=lenS;i++) {
        int j = f2[i - 1];
        while( j != -1 && (S[j] != S[i-1] || 2*(j + 1) > i) )
            j = f1[j];
        f2[i] = j + 1, num[i] = cnt[f2[i]] + 1;
    }
    int ans = 1;
    for(int i=1;i<=lenS;i++)
        ans = 1LL*ans*(num[i] + 1)%MOD;
    printf("%d\n", ans);
}
int main() {
    int n; scanf("%d", &n);
    for(int i=1;i<=n;i++)
        solve();
}

@details@

P.S：本篇博客是供博主复习所用，所以有很多简略的地方以及描述不清的地方。

@bzoj - 3670@ [Noi2014]动物园

标签：esc 顺序 amp ons strlen 题解复习测试讲解

原文地址：https://www.cnblogs.com/Tiw-Air-OAO/p/11845374.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行