标签:递归 回溯 也会 bsp class enc 工作 group 常用
(原创文章,谢绝转载~)
日常开发中,常用正则表达式方便的进行匹配、筛选工作。正则的常用内容有:
注意:对于大部分正则引擎,匹配规则是从左至右优先,因而,string|stringlong 会匹配到 stringlong 的 string 部分;
少数 Text-Directed Engine 的匹配规则则是最长优先,此时 string|stringlong 会匹配到 stringlong ;
例如 char?? ,本来一个问号是 0-1,再lazy模式,则越少越好,0次,于是char?? 可匹配 cha 而不能匹配 char
再如 char+? ,本来一个加号是1-无穷,再lazy模式,则越少越好,1次,于是char+? 可匹配 char 而不能匹配 charr ,charrr等
例如 char++, 越多越好 ,charrrrr,有多少r匹配到多少,
另一方面,不回溯,是什么含义呢,考虑以下问题: char++r, 它能否匹配 charrrrr ?答案是 不能。事实上:
cha r++ r
cha rrrr r 看过去好像可以让r++ 匹配4个r,最后一个r匹配r,这样正好匹配上,但因为独占模式是越多越好,所以第5个r 也会被 r++ 匹配到,也就是下图所示:
cha r++ r
cha rrrrr r++ 匹配到 rrrrr, 一旦匹配上则占有,不会再回溯(减少r的数量),因而 char++r 中的最后一个r ,没有东西和它匹配,所以匹配失败。
细思则有: char++r 无法匹配任何形式。。。
捕获组和索引值(Capturing Groups and Backreferences )
捕获组 用括号括住捕获部分,(regex),例如 (regex1)(regex2){3} ,regex1 和regex2 分别为两个捕获组,且分别具有索引值1和2,
注意:索引值序列123...的编码顺序为根据括号先从左至右,从外到内递归,
例如 (str1)(str(str3))(str4), str1索引值为1,(str(str3)) 整体索引值为2,str3 索引值为3,str4 索引值为 4。
标签:递归 回溯 也会 bsp class enc 工作 group 常用
原文地址:http://www.cnblogs.com/randomstring/p/7233237.html