程序实现的功能是统计文件中出现的词和每个词的频数。 这里的词的规定和平时语言上的规定不太一样,但是更标准化,规定了长度、组成字符和分隔符,在实现中也从这几个方面来寻找词。 要统计词频首先要能够判断两个词是否相同,这里用简单的字符串匹配来实现 统计的过程很简单,扫描文件,每找到一个词,先判断它是否是一 ...
分类:
其他好文 时间:
2016-10-13 01:55:54
阅读次数:
218
http://www.ruanyifeng.com/blog/2013/05/Knuth%E2%80%93Morris%E2%80%93Pratt_algorithm.html ...
分类:
编程语言 时间:
2016-10-12 11:03:16
阅读次数:
135
正则表达式(regular expression)描述了一种字符串匹配的模式,可以用来检查一个串是否含有某种子串、将匹配的子串做替换或者从某个串中取出符合某个条件的子串等。列目录时, dir *.txt或ls *.txt中的*.txt就不是一个正则表达式,因为这里*与正则式的*的含义是不同的。正则表 ...
分类:
其他好文 时间:
2016-10-11 18:18:41
阅读次数:
183
shell中截取字符串的方法有很多中,本人对其中几种常用的进行整理总结。0x01、grep在文件中搜寻字符串匹配的行并输出Linux系统中grep命令是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来。grep全称是GlobalRegularExpressionPrint,表示全局正则..
分类:
系统相关 时间:
2016-10-11 01:02:12
阅读次数:
567
首先我们需要了解什么是模式匹配?
子串定位运算又称为模式匹配(Pattern Matching)或串匹配(String Matching)。在串匹配中,一般将主串称为目标串,将子串称为模式串。本篇博客...
分类:
编程语言 时间:
2016-10-06 17:42:48
阅读次数:
342
一、正则表达式-简介 1. 概念 正则表达式,描述了一种字符串匹配的模式,可以用来检查一个串是否含有某种子串、将匹配的子串做替换或者从某个串中取出符合某个条件的子串等。 2. 特点 (1) 灵活性、逻辑性和功能性非常的强; (2)可以迅速地用极简单的方式达到字符串的复杂控制。 (3)对于刚接触的人来 ...
分类:
其他好文 时间:
2016-10-06 12:48:43
阅读次数:
153
http://www.cnblogs.com/zyf0163/p/4806951.html hash函数对大家来说不陌生吧 ? 而这次我们就用hash函数来实现字符串匹配。 首先我们会想一下二进制数。 对于任意一个二进制数,我们将它化为10进制的数的方法如下(以二进制数1101101为例): has ...
分类:
编程语言 时间:
2016-10-05 15:27:45
阅读次数:
223
题意:两个串匹配,检测第二个串在第一个串中出现几次,不过,在第一个中步长是k,kmp模板,不过nm足以过了,为啥非要kmp,速度还慢 ...
分类:
其他好文 时间:
2016-10-04 20:50:41
阅读次数:
257
【题意:】 t次操作,每次操作有下述三种类型: + a 往multiset中增加一个非负整数a,允许相同的数出现 - a 从multiset中减去一个非负整数a,执行此操作时保证multiset存在该非负整数a ? s 询问multiset中有多少个数与模式串s匹配(匹配的定义:模式串中,'0'表示 ...
分类:
其他好文 时间:
2016-10-04 11:39:06
阅读次数:
156
最长子序列:匹配的字符不需要连续。 最长子串: 匹配的字符需要连续,可能有多种结果。 解决思路:将输入字符串1看作行, 输入字符串2看作列,构成二位数组,然后将对角线匹配字符的值标记为1,计算满足条件的匹配字符个数即可。 基本思想: 空间换时间,动态规划。 图解与公式(只针对最长子序列,最长子串类似 ...
分类:
编程语言 时间:
2016-10-02 12:46:44
阅读次数:
297