业务场景是客户在业务办理时候需要提交一个材料列表,材料会入材料库,下次客户再来办理业务时候输入客户的身份证,会通过材料库进行加载,我们通过材料名称匹配材料相似度就不用再手动上传材料。(首先需要IKAnalyzer2012FF_u1.jar 进行下载支持的jar) 1.以下是对两个词进行处理的核心算法 ...
分类:
其他好文 时间:
2016-05-03 10:32:45
阅读次数:
217
记几个判断相关的简单例子 1. 文件相关判断比较 执行结果如下: 2. 数字相关判断 a. b. 执行结果如下: b. 执行结果如下: 3. 字符串比较 执行结果如下: 两次对1*的比较,分别是模式匹配和全字符串匹配 ...
分类:
系统相关 时间:
2016-05-01 14:44:08
阅读次数:
262
一、串及串匹配
如何在字符串数据中,监测和提取以字符串形式给出的某一局部特性
这类操作都属于串模式匹配(string pattern matching)范畴,简称串匹配
一般地,即:
对基于同一字符表的任何文本串T(|T| = n)和模式串P(|P| = m):
判定T中是否存在某一子串与P相同
若存在(匹配),则报告该子串在T中的起始位置
串的长度n和m本身...
分类:
其他好文 时间:
2016-04-29 16:30:24
阅读次数:
187
1)暴力法O(m+n) 2)KMP、Boyer_Mooer、Rabin_Rarp 暴力法 int strStr(String haystack, String needle){ if ( needle.empty() ) return 0; if ( haystack.size() -1 && pa... ...
分类:
编程语言 时间:
2016-04-27 22:36:22
阅读次数:
258
一、什么是正则表达式? 1.定义: 正则表达式(regular expression)描述了一种字符串匹配的模式,可以用来检查一个串是否含有某种子串、将匹配的子串做替换或者从某个串中取出符合某个条件的子串等。构造正则表达式的方法和创建数学表达式的方法一样。也就是用多种元字符与运算符可以将小的表达式结 ...
分类:
其他好文 时间:
2016-04-24 15:28:31
阅读次数:
161
正则表达式: 声明: 方法: 字符串正则: 方法: search():字符串查找,有的话输出字符串的位置,没有的话输出-1 match():字符串匹配 replace():字符串替换 split():字符串转换为数组 ...
分类:
编程语言 时间:
2016-04-24 00:38:01
阅读次数:
230
我们这里说的KMP不是拿来放电影的(虽然我很喜欢这个软件),而是一种算法。KMP算法是拿来处理字符串匹配的。换句话说,给你两个字符串,你需要回答,B串是否是A串的子串(A串是否包含B串)。比如,字符串A="I'm matrix67",字符串B="matrix",我们就说B是A的子串。你可以委婉地问你的MM:“假如你要向你喜欢的人表白的话,我的名字是你的告白语中的子串吗?”
解决这类问题,通常我们的方...
分类:
编程语言 时间:
2016-04-22 20:22:26
阅读次数:
203
串(string或字符串)是由零个或多个字符组成的有限序列,一般记为 其中s是串的名,用单引号括起来的字符序列是串的值;ai(1
串中任意个连续的字符组成的子序列称为该串的子串。包含子串的串相应的称为主串。通常称字符在序列中的序号为该字符在串中的位置。子串在主串中的位置则以子串的第一个字符在主串中的位置来表示。
下面主要说一下串的模式匹配算法
传统的串匹配法
算法的基本思想是:从主串...
分类:
编程语言 时间:
2016-04-22 20:10:05
阅读次数:
229
题目链接: http://acm.hdu.edu.cn/showproblem.php?pid=1686 题目描述: 给出两个串,分别为a,b,问a串在b串中出现了几次?(其实位置不同,就算不同的串) 解题思路: 字符串匹配首选KMP算法,刚开始的时候,每次匹配成功一个子串后,我就把母串中的指针指向 ...
分类:
其他好文 时间:
2016-04-21 18:06:35
阅读次数:
116
本博文参考http://blog.csdn.net/v_july_v/article/details/7041827
关于其他字符串匹配算法见http://blog.csdn.net/WINCOL/article/details/4795369
暴力匹配算法
暴力匹配的思路,假设现在文本串S匹配到 i 位置,模式串P匹配到 j 位置,则有:
如果当前字符匹配...
分类:
编程语言 时间:
2016-04-19 20:00:47
阅读次数:
776