o(︶︿︶)o 唉,也是为了应付知识储备太少,万一遇到了类似的题不知道用啥算法就蛋疼了,所以来恶补一下这些东西。
囤一发模板,详细讲解请见2009罗橞骞的论文《后缀数组--处理字符串的有力工具》,基本网上所有的讲解都是来自这篇文章,代码也是这篇论文上的,就不说啥了。
#include<bits/stdc++.h> using namespace std; #define MAXN 100010 char s[MAXN]; int A[MAXN]; //为了方便基数排序,我们把s中的字符转换成数字.s和A的下标使用统一0-n-1 int sa[MAXN],rank[MAXN];//最后结果的rank和sa int Count[MAXN];//基数排序计数器 int l[MAXN],r[MAXN],tmp[MAXN];//基数排序共有两个关键字,r为第二关键字基数排序结果,l值即临时rank值. int n,maxn;//计数上界 bool comp(int *A,int a,int b,int len)//字符串比较 { return A[a]==A[b]&&A[a+len]==A[b+len]; } int main() { /*省略读入等奇怪的过程*/ int i,j,k,*x=l,*y=r;//后面会整体交换l,r为了方便使用指针 for (i=0;i<maxn;i++) Count[i]=0; for (i=0;i<n;i++) Count[x[i]=A[i]]++;//第一次基数排序 for (i=1;i<maxn;i++) Count[i]+=Count[i-1]; for (i=n-1;i>=0;i--) sa[--Count[x[i]]]=i;//初始的sa for (k=1,i=1;i<n;k<<=1,maxn=i) { for (i=0,j=n-i;j<n;j++) y[i++]=i;//第二次基数排序 for (j=0;j<n;j++) if (sa[j]>=k) y[i++]=sa[j]-k; for (j=0;j<n;j++) tmp[j]=x[y[j]]; for (j=0;j<maxn;j++) Count[j]=0; for (j=0;j<n;j++) Count[tmp[j]]++; for (j=1;j<maxn;j++) Count[j]+=Count[j-1]; for (j=n-1;j>=0;j--) sa[--Count[tmp[j]]]=y[j];//更新sa for (swap(x,y),i=1,x[sa[0]]=0,j=1;j<n;j++) x[sa[j]]=comp(y,sa[j-1],sa[j],k)?i-1:i++;//更新rank //在更新过程中可能有两字符串rank值相同,此时比较两字符串是否完全相同来区分rank值 //由于y数组在被用来更新sa后已经无用(下一次会重新求),节省空间使用y保存rank } }
版权声明:本文为博主原创文章,转载请注明出处http://blog.csdn.net/hitwhacmer1
原文地址:http://blog.csdn.net/hitwhacmer1/article/details/47991805