yz是Z国的领导人,他规定每个地区的名字只能为26个小写拉丁字母的一个。由于地 区数有可能超过26个,便产生了一个问题,如何辨别名字相同的地区?于是yz规定,一个 地区的描述必须包含它的所有上级,且上级按次序排列。于是,一个地区的描述是一个字符 串。比如说,一个地区的名字为c,它的上级为b,b的上级为a,a没有上级,那么这个地 区就描述为abc。显然,这个描述同时包含了c的上级b和b的上级a的描述,分别为ab和a。 值得注意的是,每个地区最多有一个上级,同一上级的地区之间名字不同,没有上级的 地区之间名字不同。现在,yz对外公布了n个地区的描述,这些描述中包含了Z国所有地区的描述,并让 你处理来访者的旅行问题。现有m对人访问这个国家,对于每对人,第一个人喜欢第i个描述中的第j个地区,设 这个地区描述为s1,第二个人喜欢第k个描述中的第l个地区,设这个地区描述为s2。他们为了统一行程,决定访问描述为s的地区(显然他们只关心地区的名字,并非是地区本身), 设s的长度为t,s需要满足以下条件:
1:t<=j, t<=l;
1:s[1..t] = s1[j-t+1 … j], s[1..t] = s2[l-t+1 … l];(即s为s1中1到k位 与s2中1到l位的公共后缀)
2:t最大化。
为了不使输出过大,你只需把这个字符串按照如下生成的26进制数转成10进制后mod 1000000007后输出:
a->0
b->1
.
.
.
z->25
比如地区cab被编码成2 * 26? + 0 * 26? + 1 * 26? = 1353。
第一行给定一个整数n
第2…n+1行:每i+1行给定一个字符串a[i],表示第i个描述。
接下来一行一个整数m
接下来m行:每行给定四个整数i,j,k,l,字母含义与题目描述一致。
【数据范围】
设这个国家地区总数数为tot(注意:输入的字符串总长度可能超过tot!) 对于30%的数据,满足tot,m,n<=100;
对于50%的数据,满足tot,m,n<=1000;
对于80%的数据,满足tot,m,n<=100000;
对于100%的数据,满足tot,m,n<=1000000;
保证输入文件不超过20MB。
1、AC自动机构造fail树,抽离fail树构图(失配指针指向的点 向 当前点 连边)
2、在fail树中找到 s1、s2 的结尾点,两点的lca就是答案
正确性分析:
fail指针定义:在其他串中找一个最长的 前缀等于这个串的后缀
在fail树构出的图中,沿fail指针向上跳所经过的点,一定是当前串的最长后缀
且越往上跳,后缀长度单调不上升
题目要求:两个串的最长公共后缀,且这个后缀是某个串的前缀
所以就是两个串的结尾点在fail树中的lca
这题卡空间,卡空间
数组范围抄的大佬的题解
1、lca
① 抽离fail树构图求lca时,因为空间有限,所以不选树链剖分,用倍增法
② 因为点的父节点就是失配指针指向的点,所以可以在求fail指针时,同时算出deep,f[i][0]
③ 节省一个dfs 时间,所以倍增求lca时,选用根据深度判断的方法,而不是dfs序
节省链表重新构图空间、时间,所以不用树链剖分、dfs序倍增法
2、锁定字符串末节点的位置
① 节省时间,不在AC自动机上匹配一遍,因为告诉了了第i个字符串的前j个,所以在insert字符串时,可以记录
② 节省空间,不用二维数组a[N][26]表示第i个字符串的第j个节点在AC自动机的什么位置
因为是顺序插入,用一个st[i]数组,表示前i-1个字符串用了多少个节点,
pos[i]数组,表示所有字符串的第i个字母在AC自动机的那个位置(第1个字符串的所有字母在最前面,然后是第2个字符串,第3、4……)
这样第i个字符串的第j个字母在AC自动机中的位置就是 pos[st[i]+j]
为什么要引入st数组?因为AC自动机相同前缀用同一个节点
代码中倍增求lca时,循环到了20,
我的理解:只需循环到log2(n)+1 ,因为倍增是2^i,i大了没用
但是 引入 int p=log(n)/log(2)+1; 就错了
(c++ 默认log函数以自然对数为底)
call 大佬求解
#include<cmath>
#include<queue>
#include<cstdio>
#include<cstring>
#include<algorithm>
#define N 1000010
#define mod 1000000007
using namespace std;
char s[N];
int pos[N*8],st[N],cnt; //
int key[N];
int n,m,iid,len,root,p;
int tot=1,trie[N][26];
int ancestor[N][22],deep[N];
queue<int>q;
struct TREE
{
void pre()
{
for(int i=1;i<=20;i++)
for(int j=1;j<=tot;j++)
ancestor[j][i]=ancestor[ancestor[j][i-1]][i-1];
}
int getlca(int u,int v)
{
if(deep[u]<deep[v]) swap(u,v);
for(int i=0;i<=20;i++)
if((deep[u]-deep[v])&(1<<i)) u=ancestor[u][i];
if(u==v) return u;
for(int i=20;i>=0;i--)
if(ancestor[u][i]!=ancestor[v][i])
{
u=ancestor[u][i];
v=ancestor[v][i];
}
return ancestor[u][0];
}
};
TREE tree;
struct ACautomata
{
void insert(int k)
{
st[k]=cnt;
len=strlen(s); root=1;
for(int i=0;i<len;i++)
{
iid=s[i]-‘a‘;
if(!trie[root][iid])
{
trie[root][iid]=++tot;
key[tot]=(1ll*key[root]*26+iid)%mod;
}
root=trie[root][iid];
pos[++cnt]=root;
}
}
void getfail()
{
for(int i=0;i<26;i++) trie[0][i]=1;
q.push(1);
int now,j;
while(!q.empty())
{
now=q.front(); q.pop();
for(int i=0;i<26;i++)
{
if(!trie[now][i])
{
trie[now][i]=trie[ancestor[now][0]][i];
continue;
}
q.push(trie[now][i]);
j=ancestor[now][0];
//while(!trie[j][i]) j=ancestor[j][0];
ancestor[trie[now][i]][0]=trie[j][i];
deep[trie[now][i]]=deep[trie[j][i]]+1;
}
}
}
};
ACautomata AC;
int main()
{
scanf("%d",&n);
// int p=log(n)/log(2)+1;
for(int i=1;i<=n;i++)
{
scanf("%s",s);
AC.insert(i);
}
AC.getfail();
tree.pre();
scanf("%d",&m);
int i,j,k,l,r1,r2,lca;
while(m--)
{
scanf("%d%d%d%d",&i,&j,&k,&l);
lca=tree.getlca(pos[st[i]+j],pos[st[k]+l]);
printf("%d\n",key[lca]);
}
}