码迷,mamicode.com
首页 > 编程语言 > 详细

Python re正则表达式速查

时间:2017-08-21 20:42:42      阅读:278      评论:0      收藏:0      [点我收藏+]

标签:net   数字   正则表达式   text   进制   top   多行模式   isa   .com   

技术分享

常见正则表达式符号和特殊字符

表示法

描述

正则表达式示例

符号

re1|re2

匹配正则表达式re1re2

foo|bar

.

匹配任意除换行符"\n"外的字符

a.c

^

匹配字符串开头,在多行模式中匹配每一行的开头

^Dear

$

匹配字符串末尾,在多行模式中匹配每一行的末尾

/bin/*sh$

*

匹配前一个字符0或多次

[A-Za-z0-9]*

+

匹配前一个字符1次或多次

[a-z]+\.com

?

匹配一个字符0次或1

goo?

{}

{m}匹配前一个字符m次,{m,n}匹配前一个字符mn

[0-9]{3} ,[0-9]{5,9}

[...]

匹配字符集中的任意单个字符

[aeiou]

[^...]

不匹配字符集中的任意一个字符

[^aeiou],[^A-Za-z0-9]

[x-y]

X~y范围中的任何一个字符

[b-x]

()

匹配封闭的正则,存为子组,从表达式左边开始每遇到一个分组的左括号“(”,编号+1

([0-9]{3})?,f(oo|u)bar

特殊字符

\d

匹配任何十进制数(\D 相反)<=> [0-9]

data\d+.txt

\w

任何字母数字(\W 相反)  <=>  [A-Za-z0-9]

[A-Za-z]\w+

\s

任何空格字符(\S 相反) <=> [\n\t\r\v\f]

of\sthe

\b

匹配任何单词边界(\B相反

\bThe\b

\A(\Z)

匹配字符串起始(结束) <=> ^($)

\ADear

扩展表示法

(?iLmsux)

编译选项指定,可以写在findallcompile的参数中,也可以写在正则式里

(?x), (?im)

(?#...)

表示注释,所有内容被忽略

(?#comment)

(?:...)

表示一个匹配不用保存的分组

(?:\w+\.)

(?=...)

如果 ... 出现在要匹配字符串的后面

例如:Isaac (?=Asimov) 只匹配 ‘Isaac ‘ 后面跟 ‘Asimov‘的字符串

 (?=.com)

(?!...)

 如果 ... 不出现在要匹配字符串后面

 (?!.net)

(?<=...)

 如果 ... 出现在之前的位置,则匹配

 (?<=800-)

(?<!...)

 如果 ... 不出现在之前的位置,则匹配

 (?<!192\.168\.)

(?(id/name)yes-pattern|no-pattern)

 如果 group 中的 id/name 存在匹配 yes-pattern,否则 no-pattern  例如:(<)?(\w+@\w+(?:\.\w+)+)(?(1)>)只会匹配 <user@host.com> 或者 user@host.com 不会匹配 <user@host.com

 (?(1)y|x)

(?P<name>...)

 分组,除了原有的编号外再指定一个额外的别名

 (?P<id>abc){2}

(?P=name)

 引用别名为<name>的分组匹配到字符串

 (?P<id>\d)abc(?P=id)

Python re正则表达式速查

标签:net   数字   正则表达式   text   进制   top   多行模式   isa   .com   

原文地址:http://www.cnblogs.com/trojan-z/p/7406335.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!