标签:需求 成功 并且 场景 相关 dal height width log
正则详细教程系列可以看此链接的文章哦
https://www.cnblogs.com/poloyy/category/1796055.html
首先,贪婪模式和非贪婪模式跟前面讲到的量词密切相关,我们先再来看看有哪些量词
只匹配一个结果
可以看到会匹配了三个空字符串,我们再通过 Python 代码看看输出结果
的确是会有三个空字符串
因为 * 代表 0 到多次,匹配 0 次就是空字符串
aaa 之间的空字符串咋没匹配上呢?
这就要说到我们的贪婪、非贪婪模式了
在正则中,表示次数的量词默认是贪婪的,在贪婪模式下,会尝试尽可能最大长度去匹配
a* 在匹配开头的 a 时,会尽量匹配更多的 a,直到第一个 b 不满足要求为止,匹配上三个 a,后面每次匹配时都得到空字符串
在量词后面加上 ? ,正则就变成了 a*?
贪婪匹配:匹配上从第一个 " 到最后一个 " 之间的所有内容
非贪婪匹配:找到符合要求的结果
这一小节基本都搬了《正则表达式入门课》的内容
正则是贪婪
匹配过程 {1,3} 会尽可能长地去匹配
当匹配完 xyy 后,由于 y 要尽可能匹配最长,即三
但字符串中后面是个 z 就会导致匹配不上,这时候正则就会向前回溯,吐出当前字符 z,接着用正则中的 z 去匹配
正则 | 文本 | 匹配结果 |
xy{1,3}?z | xyyz | xyyz |
独占模式和贪婪模式很像,独占模式会尽可能多地去匹配,如果匹配失败就结束,不会进行回溯,这样的话就比较节省时间
在量词后加上 +
Python 和 Go 的标准库目前都不支持独占模式
pip install regex
>>> import regex 4 >>> regex.findall(r‘xy{1,3}z‘, ‘xyyz‘) # 贪婪模式 [‘xyyz‘] >>> regex.findall(r‘xy{1,3}+z‘, ‘xyyz‘) # 独占模式 [‘xyyz‘] >>> regex.findall(r‘xy{1,2}+yz‘, ‘xyyz‘) # 独占模式 []
a{1,3}+ab 去匹配 aaab 字符串,a{1,3}+ 会把前面三个 a 都用掉,并且不会回溯,这样字符串中内容只剩下 b 了,导致正则中加号后面的 a 匹配不到符合要求的内容, 匹配失败
如果是贪婪模式 a{1,3} 或非贪婪模式 a{1,3}? 都可以匹配上
标签:需求 成功 并且 场景 相关 dal height width log
原文地址:https://www.cnblogs.com/poloyy/p/13222278.html