码迷,mamicode.com
首页 > 其他好文 > 详细

BZOJ3473 字符串 【广义后缀自动机】

时间:2018-03-09 22:48:08      阅读:229      评论:0      收藏:0      [点我收藏+]

标签:print   节点   main   length   位置   cout   完全   markdown   cstring   

题目

给定n个字符串,询问每个字符串有多少子串(不包括空串)是所有n个字符串中至少k个字符串的子串?

输入格式

第一行两个整数n,k。
接下来n行每行一个字符串。

输出格式

一行n个整数,第i个整数表示第i个字符串的答案。

输入样例

3 1

abc

a

ab

输出样例

6 1 3

提示

对于 100% 的数据,1<=n,k<=10^5,所有字符串总长不超过10^5,字符串只包含小写字母。

题解

我们先建一个广义后缀自动机
然后用每个原串在SAM上走,走到的节点就是parent树的叶子节点,将其沿parent边一直往上+1,表示这些节点表示的字符串+1【当然只能加一次,所以再开一个数组cur[]表示加过没有】
处理完后,我们就可以统计答案了

先拓扑排序,设f[]为该位置满足题意的字符串个数,显然如果一个位置累加的字符串>=k,那么该位置表示的至少为\(step[u] - step[pre[u]]\)
但还不完全,父亲的代表的字符串个数同样也符合该点

然后每个串再在SAM上走一遍统计答案即可

#include<iostream>
#include<cstdio>
#include<cmath>
#include<string>
#include<cstring>
#include<algorithm>
#define LL long long int
#define Redge(u) for (int k = h[u],to; k; k = ed[k].nxt)
#define REP(i,n) for (int i = 1; i <= (n); i++)
#define BUG(s,n) for (int i = 1; i <= (n); i++) cout<<s[i]<<‘ ‘; puts("");
using namespace std;
const int maxn = 200005,maxm = 100005,INF = 1000000000;
inline int read(){
    int out = 0,flag = 1; char c = getchar();
    while (c < 48 || c > 57){if (c == ‘-‘) flag = -1; c = getchar();}
    while (c >= 48 && c <= 57){out = (out << 3) + (out << 1) + c - 48; c = getchar();}
    return out * flag;
}
string s[maxn];
char ss[maxn];
int ch[maxn][26],pre[maxn],step[maxn],sz[maxn],cnt,last,n,k,cur[maxn];
LL f[maxn];
int ins(int x){
    int p = last,np = ++cnt; step[np] = step[p] + 1; last = np;
    while (p && !ch[p][x]) ch[p][x] = np,p = pre[p];
    if (!p) pre[np] = 1;
    else {
        int q = ch[p][x];
        if (step[q] == step[p] + 1) pre[np] = q;
        else {
            int nq = ++cnt; step[nq] = step[p] + 1;
            for (int i = 0; i < 26; i++) ch[nq][i] = ch[q][i];
            pre[nq] = pre[q]; pre[np] = pre[q] = nq;
            while (ch[p][x] == q) ch[p][x] = nq,p = pre[p];
        }
    }
    return np;
}
int b[maxn],a[maxn];
LL ans;
void tsort(){
    REP(i,cnt) b[step[i]]++;
    REP(i,cnt) b[i] += b[i - 1];
    for (int i = cnt; i; i--) a[b[step[i]]--] = i;
}
int main(){
    n = read(); k = read();
    last = cnt = 1;
    for (int i = 1; i <= n; i++){
        last = 1;
        scanf("%s",ss); s[i] = string(ss);
        int len = strlen(ss);
        for (int i = 0; i < len; i++) ins(ss[i] - ‘a‘);
    }
    int u;
    for (int i = 1; i <= n; i++){
        u = 1;
        for (int j = 0; j < s[i].length(); j++){
            u = ch[u][s[i][j] - ‘a‘];
            for (int p = u; p && cur[p] != i; p = pre[p])
                sz[p]++,cur[p] = i;
        }
    }
    tsort();
    sz[1] = 0;
    for (int i = 1; i <= cnt; i++)
        u = a[i],f[u] = f[pre[u]] + (sz[u] >= k ? step[u] - step[pre[u]] : 0);
    for (int i = 1; i <= n; i++){
        ans = 0; u = 1;
        for (int j = 0; j < s[i].length(); j++){
            u = ch[u][s[i][j] - ‘a‘];
            ans += f[u];
        }
        printf("%lld ",ans);
    }
    return 0;
}

BZOJ3473 字符串 【广义后缀自动机】

标签:print   节点   main   length   位置   cout   完全   markdown   cstring   

原文地址:https://www.cnblogs.com/Mychael/p/8536479.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!