码迷,mamicode.com
首页 > 编程语言 > 详细

后缀数组(一)

时间:2015-08-26 01:50:44      阅读:189      评论:0      收藏:0      [点我收藏+]

标签:算法   后缀数组   模板   



o(︶︿︶)o 唉,也是为了应付知识储备太少,万一遇到了类似的题不知道用啥算法就蛋疼了,所以来恶补一下这些东西。

囤一发模板,详细讲解请见2009罗橞骞的论文《后缀数组--处理字符串的有力工具》,基本网上所有的讲解都是来自这篇文章,代码也是这篇论文上的,就不说啥了。

#include<bits/stdc++.h>
using namespace std;
#define MAXN 100010
char s[MAXN];
int A[MAXN];
//为了方便基数排序,我们把s中的字符转换成数字.s和A的下标使用统一0-n-1 
int sa[MAXN],rank[MAXN];//最后结果的rank和sa
int Count[MAXN];//基数排序计数器 
int l[MAXN],r[MAXN],tmp[MAXN];//基数排序共有两个关键字,r为第二关键字基数排序结果,l值即临时rank值. 
int n,maxn;//计数上界 
bool comp(int *A,int a,int b,int len)//字符串比较 
{
    return A[a]==A[b]&&A[a+len]==A[b+len];
}
int main()
{
    /*省略读入等奇怪的过程*/
    int i,j,k,*x=l,*y=r;//后面会整体交换l,r为了方便使用指针 
    for (i=0;i<maxn;i++)    Count[i]=0;
    for (i=0;i<n;i++)   Count[x[i]=A[i]]++;//第一次基数排序 
    for (i=1;i<maxn;i++)    Count[i]+=Count[i-1];
    for (i=n-1;i>=0;i--)    sa[--Count[x[i]]]=i;//初始的sa 
    for (k=1,i=1;i<n;k<<=1,maxn=i)
    {
        for (i=0,j=n-i;j<n;j++) y[i++]=i;//第二次基数排序
        for (j=0;j<n;j++)   if (sa[j]>=k)   y[i++]=sa[j]-k;
        for (j=0;j<n;j++)   tmp[j]=x[y[j]];
        for (j=0;j<maxn;j++)    Count[j]=0;
        for (j=0;j<n;j++)   Count[tmp[j]]++;
        for (j=1;j<maxn;j++)    Count[j]+=Count[j-1];
        for (j=n-1;j>=0;j--)    sa[--Count[tmp[j]]]=y[j];//更新sa 
        for (swap(x,y),i=1,x[sa[0]]=0,j=1;j<n;j++)  x[sa[j]]=comp(y,sa[j-1],sa[j],k)?i-1:i++;//更新rank
        //在更新过程中可能有两字符串rank值相同,此时比较两字符串是否完全相同来区分rank值
        //由于y数组在被用来更新sa后已经无用(下一次会重新求),节省空间使用y保存rank 
    }
}


o(︶︿︶)o 唉,也是为了应付知识储备太少,万一遇到了类似的题不知道用啥算法就蛋疼了,所以来恶补一下这些东西。

版权声明:本文为博主原创文章,转载请注明出处http://blog.csdn.net/hitwhacmer1

后缀数组(一)

标签:算法   后缀数组   模板   

原文地址:http://blog.csdn.net/hitwhacmer1/article/details/47991805

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!