正则表达式简介:正则表达式是用于描述字符排列和匹配模式的一种语法规则。它主要用于字符串的模式分割、匹配、查找及替换操作。到目前为止,我们前面所用过的精确(文本)匹配也是一种正则表达式。在PHP中,正则表达式一般是由正规字符和一些特殊字符(类似于通配符)联合构成的一个文本模式的程序性描述。...
分类:
其他好文 时间:
2015-06-02 10:54:06
阅读次数:
150
题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=2846题目大意:有多个文本,多个模式串。问每个模式串中,有多少个文本?(匹配可重复)解题思路:传统AC自动机是计算单个文本中,模式串出现次数。这里比较特殊,每个文本需要单独计算,而且每个匹配在每个文本中只...
分类:
其他好文 时间:
2015-05-27 15:27:55
阅读次数:
113
cosin余弦相似度
两个向量间的余弦值可以很容易地通过使用欧几里得点积和量级公式推导:
鉴于两个向量的属性, A 和B的余弦相似性θ用一个点积形式来表示其大小,如下所示:
产生的相似性范围从-1到1:-1意味着两个向量指向的方向正好截然相反,1表示它们的指向是完全相同的,0通常表示它们之间是独立的,而在这之间的值则表示中度的相似性或相异性。 对于文本匹配,属性向量A 和B 通常...
分类:
其他好文 时间:
2015-05-12 00:10:19
阅读次数:
840
1.Goto Anything-快速查找(ctrl + P) 输入@+函数名可以快速找到函数输入#+文本可以快速进行文件内文本匹配2.命令模式Ctrl+Shift+P:打开命令面板 Ctrl+P:搜索项目中的文件 Ctrl+W:关闭当前打开文件Ctrl+Shift+W:关闭所有打开文件Ctrl+S....
后缀数组
后缀数组就是把一个文本串的所有后缀按字典序从小到大排放的数组。详细介绍见刘汝佳《算法竞赛训练指南》。
AC自动机可以处理多模板的文本匹配问题,而后缀数组也可以处理多模板的文本匹配问题。那么它们有什么区别呢?
AC自动机需要事先知道所有的模板,然后对于一个(在线输入的)文本串进行多模板匹配,也就是说模板一定要全部事先知道,需要匹配...
分类:
编程语言 时间:
2015-03-31 00:53:25
阅读次数:
208
正则表达式(Regular Expression)
正则表达式,又称正规表示式、正规表示法、正规表达式、规则表达式、常规表示法(英语:Regular Expression,在代码中常简写为regex、regexp或RE)。
正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。在很多文本编辑器里,正则表达式通常被用来检索、替换那些符合某个模式的文本。
元字符
字符...
分类:
其他好文 时间:
2015-01-19 17:18:39
阅读次数:
214
正则表达式是用于进行文本匹配的工具,所以本文里多次提到了在字符串里搜索/查找,这种说法的意思是在给定的字符串中,查找与给定的正则表达式相匹配的部分。有可能字符串里有不止一个部分满足给定的正则表达式,这时每一个这样的部分被称为一个匹配。匹配在本文里可能会有三种意思:一种是形容词性的,比如说一个字符串匹...
分类:
其他好文 时间:
2014-12-25 00:11:51
阅读次数:
276
来源:http://www.cnblogs.com/index-html/archive/2013/04/17/js_keyword_match.htmlhttp://www.etherdream.com/funnyscript/Keyword/Keyword.html适用于多关键字、大文本匹配,若...
分类:
编程语言 时间:
2014-11-23 22:56:40
阅读次数:
272
回溯引用:前后一致匹配
回溯引用(backreference)在文本匹配和文本替换操作里非常有用。
例子1:匹配HTML中任意一级的标题栏中的内容例如:nihao
模式1:.*? 【注意这里使用懒惰型的*】
但是这里模式不是正确的:例如:abcd 显示不是正确的
模式2:.*? 正确
回溯引用匹配:模式的后半部分引用在前半部分中定义的子表达式【允许正...
分类:
其他好文 时间:
2014-11-08 20:52:17
阅读次数:
204
在 javascript 中,正则表达式由两部分组成:正则表达式的匹配模式文本;匹配模式文本的修饰符;修饰符:修饰符说明i忽略大小写g执行全局匹配m执行多行匹配匹配模式文本包括以下内容:括号:查找某个范围内的字符:表达式说明[abc]符合括号中的任意一个即可[^abc]括号中的均不能出现[0-9]数...
分类:
编程语言 时间:
2014-10-28 21:27:05
阅读次数:
274