标签:很多 .com 高级语言 编译 ups greedy 函数 ali 也有
TOC
Jamie Zawinski said:
Some people,when confronted with a problem,think,"I know,I‘ll use regular expressions."
Now they have two problem!
当人们遇到一个问题,想到用正则表达式解决时。他们的问题马上就变成了两个问题
调侃正则表达式不好学。
注意:
special character | means | comments |
---|---|---|
‘.‘ | 点号,代表所有字符除了newline换行符 | 如果设置了DOTALL flag标识,那就会包含newline |
‘^‘ | 代表字符串的开始,The start of the string | In MULTLINE mode在多行模式也匹配每个newline的结尾处 |
‘$‘ | 匹配the end of the string or just befor the newline at the end of the string | In MULTILINE mode also matches before a newline. |
‘\b‘ | 不匹配任何字符串,匹配单词的开头或结尾 | 如r‘\bfoo\b‘ 能匹配 ‘foo‘,‘foo.‘,‘(foo)‘,‘bar foo bar‘,但是不能匹配‘foobar‘ |
‘\B‘ | 不匹配任何字符串,是\b的反义 | |
__‘*‘__ | 匹配 0个或 多次重复 这个符号前面的RE | 贪婪 |
‘+‘ | 匹配 1个或 多次重复 这个符号前面的RE | 贪婪,注意是前面的一个RE,一个普通字符就是一个RE不是所有,是最小单位的一个RE.如 ab+ 匹配的是ab or abbb... 而不是ababab |
‘?‘ | 匹配 0个或 1次重复 这个符号前面的RE | 贪婪 |
__‘*?,??,+?‘__ | 禁掉*,?,+的贪婪,取他们能匹配的最小范围 | 非贪婪 |
‘{m}‘ | 指定数量重复 这个符号前面的RE | 非贪婪 |
‘{m,n}‘ | 指定m到n数量重复 这个符号前面的RE | 贪婪 ,n如果不指定的话,至少m个重复RE |
‘{m,n}?‘ | 指定m到n数量重复 这个符号前面的RE,但是至匹配最小数量 | 非贪婪 |
‘‘ | 转义特殊字符 | 即然特殊字符表示其字面义 |
‘[]‘ | Used to indicate a set of characters | 特殊字符在[]中会没有特殊意义;但是^符号在[]中如果是第一个字符,那么^是有意义的,这里不是表示字符串的开头,而是取反取补集 .并且在[]除了开头的^恶化]符号是有各自的意义 |
‘|‘ | 两边是RE,匹配左边或者右边,或关系 | 非贪婪,从左到右匹配 |
‘\w‘ | ||
‘\W‘ | ||
‘\d‘ | ||
‘\D‘ | ||
‘\s‘ |
等等等等。。。。
re.split(partten,string,maxsplite=0,flag=0) 将string中所有匹配的上partten的作为字符串的分隔符进行分隔字符串。如果一个没匹配上返回列表中只有string一个字符串。如果匹配上就分隔返回分隔后元素组成的列表。maxsplit指定字符串最多可以分割的次数。还要特别注意,如果partten中是用了分组,那么分组将出现在最后分隔列表中,每个元素之间。就是将分组中匹配到的也添加到列表中。
re.finditer(partten, string, flags=0) 返回一个生成器,生成器每次next()返回的是一个match对象,这个match对象是依次正则匹配上的。
正则表达式对象:
匹配对象:
参考官方手册re模块例子
标签:很多 .com 高级语言 编译 ups greedy 函数 ali 也有
原文地址:https://www.cnblogs.com/ZJiQi/p/8905011.html