标签:kmp
http://www.matrix67.com/blog/archives/115
Orz maxtix67
一直拖着到碰到了KMP算法的题才学。。
设有字符串A:abefgababef
模式串 B:abefgabef
当A与B进行匹配时,设i是A上的指针,j是B上的指针,则A和B匹配到第8位就会失配。按照常规方法,我们会将i跳回到2,j跳回到1进行匹配。观察之后我们会发现其实这是多余的,因为中间的befg都是不可能的,我们应该直接跳到A的第6位进行匹配。
KMP算法就是通过过滤这样无用字符来加快匹配速度的。。
以上面的B为例,当abefgab已经被匹配而下一位失配的时候,其实后面的ab可以直接作为新一次匹配的开头利用起来的,因为ab即是abefgab的前缀又是后缀。这为我们提供了思路,我们如果能找到已匹配字符串的最大的即是前缀又是后缀的子串(称它为前后缀好了)我们就可以直接将他放到下一次匹配中,这就减少了时间复杂度。现在的问题是如何求出模式串每一个前缀的最大的前后缀呢。。
令s[i]为模式串的第i个前缀,即前i位构成的串,p[i]为s[i]的最大前后缀长度,假设我们已知p[i],要求p[i+1],其实这是一个模式串的自身匹配过程。如果s[i+1]==s[p[i]+1]也就是最大前后缀作为前缀和作为后缀的下一位匹配上了,显然p[i+1]=p[i]+1;如果不相等,就退而求其次的找p[i]的最大前后缀,这样一直退下去,总有一个会匹配上,否则p[i+1]就为0。这样我们就得到了p数组,匹配的时候可以仿照求p的过程来进行。。
获取p数组:
void getp() { j=0;p[0]=0; for (i=1;i<m;i++) { while (j&&b[j]!=b[i]) j=p[j-1]; if (b[j]==b[i]) j++; p[i]=j; } }codevs1404:
#include<iostream> #include<cstdio> #include<memory.h> #define maxn 200005 char a[maxn],b[maxn]; int i,j,n,m,k,x,p[maxn],len[maxn],cnt[maxn]; void getp() { j=0;p[0]=0; for (i=1;i<m;i++) { while (j&&b[j]!=b[i]) j=p[j-1]; if (b[j]==b[i]) j++; p[i]=j; } } void match(char *a,char *b) { int i,j=0; for (i=0;i<n;i++) { while (j&&b[j]!=a[i]) j=p[j-1]; if (b[j]==a[i]) j++; cnt[j]++; if (j==m) j=p[j-1]; } } int main() { scanf("%d%d%d\n%s\n%s",&n,&m,&k,&a,&b); getp(); memset(cnt,0,sizeof(cnt)); match(a,b); for (i=m;i>=1;i--) cnt[p[i-1]]+=cnt[i]; for (i=1;i<=k;i++) { scanf("%d",&x); printf("%d\n",cnt[x]-cnt[x+1]); } }
标签:kmp
原文地址:http://blog.csdn.net/tag_king/article/details/45166171