码迷,mamicode.com
首页 > 编程语言 > 详细

KMP算法学习笔记

时间:2015-04-21 11:21:20      阅读:127      评论:0      收藏:0      [点我收藏+]

标签:kmp

http://www.matrix67.com/blog/archives/115

Orz maxtix67

一直拖着到碰到了KMP算法的题才学。。

设有字符串A:abefgababef

        模式串 B:abefgabef

当A与B进行匹配时,设i是A上的指针,j是B上的指针,则A和B匹配到第8位就会失配。按照常规方法,我们会将i跳回到2,j跳回到1进行匹配。观察之后我们会发现其实这是多余的,因为中间的befg都是不可能的,我们应该直接跳到A的第6位进行匹配。

KMP算法就是通过过滤这样无用字符来加快匹配速度的。。

以上面的B为例,当abefgab已经被匹配而下一位失配的时候,其实后面的ab可以直接作为新一次匹配的开头利用起来的,因为ab即是abefgab的前缀又是后缀。这为我们提供了思路,我们如果能找到已匹配字符串的最大的即是前缀又是后缀的子串(称它为前后缀好了)我们就可以直接将他放到下一次匹配中,这就减少了时间复杂度。现在的问题是如何求出模式串每一个前缀的最大的前后缀呢。。

令s[i]为模式串的第i个前缀,即前i位构成的串,p[i]为s[i]的最大前后缀长度,假设我们已知p[i],要求p[i+1],其实这是一个模式串的自身匹配过程。如果s[i+1]==s[p[i]+1]也就是最大前后缀作为前缀和作为后缀的下一位匹配上了,显然p[i+1]=p[i]+1;如果不相等,就退而求其次的找p[i]的最大前后缀,这样一直退下去,总有一个会匹配上,否则p[i+1]就为0。这样我们就得到了p数组,匹配的时候可以仿照求p的过程来进行。。

获取p数组:

void getp()
{
	j=0;p[0]=0;
	for (i=1;i<m;i++)
	{
		while (j&&b[j]!=b[i]) j=p[j-1];
		if (b[j]==b[i]) j++;
		p[i]=j;
	}
}
codevs1404:

#include<iostream>
#include<cstdio>
#include<memory.h>
#define maxn 200005
char a[maxn],b[maxn];
int i,j,n,m,k,x,p[maxn],len[maxn],cnt[maxn];
void getp()
{
	j=0;p[0]=0;
	for (i=1;i<m;i++)
	{
		while (j&&b[j]!=b[i]) j=p[j-1];
		if (b[j]==b[i]) j++;
		p[i]=j;
	}
}
void match(char *a,char *b)
{
	int i,j=0;
	for (i=0;i<n;i++)
	{
		while (j&&b[j]!=a[i]) j=p[j-1];
		if (b[j]==a[i]) j++;
		cnt[j]++;
		if (j==m) j=p[j-1];
	}
}
int main()
{
	scanf("%d%d%d\n%s\n%s",&n,&m,&k,&a,&b);
	getp();
	memset(cnt,0,sizeof(cnt));
	match(a,b);
	for (i=m;i>=1;i--) cnt[p[i-1]]+=cnt[i];
	for (i=1;i<=k;i++)
	{
		scanf("%d",&x);
		printf("%d\n",cnt[x]-cnt[x+1]);
	}
}



KMP算法学习笔记

标签:kmp

原文地址:http://blog.csdn.net/tag_king/article/details/45166171

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!