字符串匹配指有一个文本串S和一个模式串P,现在要查找P在S中的位置。
主要有以下算法:
其中朴素算法和KMP算法我们在这边bloghttp://blog.csdn.net/lu597203933/article/details/41124815中已经讲解过。RP算法时间复杂度较高,我也没看,想看可以看算法导论。这里主要讲解有限自动机的字符串匹配算法。
有限自动机的定义:
有限自动机字符串匹配主要是构建一个状态转移函数。&(q,a)表示状态q<其中状态q表示已经匹配成功q个字符了>接收字符a后的状态,就等于Pqa(接收成功的q个字符连接上a)后缀的最长P前缀的长度。
例子:
伪代码:
代码如下:
#include <iostream> #include <string> using namespace std; #define MAXSIZE 10 int transitionArray[MAXSIZE][MAXSIZE]; void computingTransition(const string &p, const string &alpha){ for(int q = 0; q < p.size(); q++){ // 初始状态q = 0 for(int i = 0; i < alpha.size(); i++){ // 所拥有的字母表 int k = q+1; string s = p.substr(0, q)+ alpha[i]; bool flag = false; for(; k > 0 && !flag; k--){ int j = 0; for( ;j < k; j++){ if(p[j] != s[s.size()-k+j])break; } if(j == k) flag= true; } if(flag) transitionArray[q][i] = ++k; else transitionArray[q][i] = 0; cout << transitionArray[q][i] << " "; } cout << endl; } } void finiteAutomationStringMatch(const string &s, int m){ int q = 0; int i = 0; for(int i = 0; i < s.size(); i++){ q = transitionArray[q][s[i]-97]; if(q == m){ cout << "YES" << endl; cout << i-m+1 << endl; break; } } if(i == s.size()) cout << "NO" << endl; } int main(){ string s("abababacaba"), p("ababaca"); string alpha = "abc"; computingTransition(p, alpha); finiteAutomationStringMatch(s, p.size()); return 0; }结果:
原文地址:http://blog.csdn.net/lu597203933/article/details/44245213