标签:
感觉写的很好,尤其是底下的公式,易懂,链接:http://www.cnblogs.com/mypride/p/4950245.html
举个例子
模式串S:a s d a s d a s d f a s d
匹配串T:a s d a s d f
如果使用朴素匹配算法——
1 2 3 4 5 6 7 8 9
a s d a s d a s d f a s d
a s d a s d f
1 2 3 4 5 6 7
此时,匹配到了S7和T7了,S7为a而T7为f,不匹配那么朴素的匹配算法会这么做——
1 2 3 4 5 6 7 8 9
a s d a s d a s d f a s d
a s d a s d f
1 2 3 4 5 6 7
这时,我们会发现,模式串回溯到了S2,而匹配串回溯到了T1。
很明显,这会极大的降低算法的效率,在最坏情况下,我们需要将模式串几乎每个元素都查询一次,而每次查询都从匹配串的串首走到接近串尾,这样的时间复杂度为n*m,其中n和m分别为模式串和匹配串的长度。
那么我们是否有可能降低时间复杂度呢?答案是肯定的——很明显我们只需要想办法减少回溯,就可以达到效果。Kmp算法就是使用这种方法节省时间的。
1 2 3 4 5 6 7 8 9
a s d a s d a s d f a s d
a s d a s d f
1 2 3 4 5 6 7
这个东西很熟悉吧?刚刚出现过一次。
那么,kmp算法会怎么执行下一步呢?答案如下——
1 2 3 4 5 6 7 8 9
a s d a s d a s d f a s d
a s d a s d f
1 2 3 4 5 6 7
注意这一步!这里的模式串根本没有回溯,只是将匹配串向后移动了若干步。这样,最坏情况只是将模式串走一遍,然后将匹配串走一遍,当然了,匹配串里 面的部分元素会走多次,但是,很明显这种算法会将n*m降低到n+k,这个k和m内部部分元素的重复次数有关,最大不会超过n(当然这是我自己证明得到 的,不一定正确,以后我还会继续证明的)。
好了,方法知道了,那么怎么实现呢?
换句话说,怎么实现迅速的移动匹配串呢?答案是——添加一个Next数组,标记匹配串中的特性。
这个Next数组的特性很明显
举例:
匹配串T: a s d a s d f
Next: -1 0 0 0 1 2 3
具体见代码——
#include <iostream> #include <cstdio> #include <cstring> #include <cmath> #include <algorithm> using namespace std; const int N = 2010; char s[N], t[N]; int Next[N]; int lenS, lenT; void kmpNext(char* T) //计算Next数组 { int i = 1; Next[0] = -1; //Next[0] = -1 while(i < lenT) { int j = 0; while(T[j] == T[i]) //Next[i] = j; { j | T[0] = T[i-j], T[1] = T[i-j+1],... , T[j-1] = T[i-1]} { Next[i] = j; i++; j++; } Next[i] = j; //同上,或等于0 i++; } } bool kmp(char* S, char* T) //kmp { lenS = strlen(S); lenT = strlen(T); kmpNext(T); int i = 0, j = 0; while(i < lenS && j < lenT) //当模式串或匹配串走完时退出 { if(j == -1) { i++; j = 0; } else if(S[i] == T[j]) { i++; j++; } else j = Next[j]; } if(j == lenT) return 1; //如果匹配串走完,表示匹配串是模式串的子串 return 0; } int main() { //freopen("test.in", "r", stdin); while(~scanf("%s%s", s, t)) { if(kmp(s, t)) printf("Yes\n"); else printf("No\n"); } return 0; }
标签:
原文地址:http://www.cnblogs.com/s1124yy/p/5659781.html