标签:
一.简介
正则表达式(或 RE)是一种小型的、高度专业化的编程语言,(在Python中)它内嵌在Python中,并通过 re 模块实现,再被编译成一系列的字节码,然后由用 C 编写的匹配引擎执行
二.常用操作
1.字符匹配
. | 代指除了换行符以外的任何字符,只能匹配一个字符 | ||||||
^ | 匹配行首 | ||||||
$ | 匹配行尾 | ||||||
* | 重复匹配0~多次,贪婪匹配 | ||||||
+ | 重复匹配1~多次,至少要匹配一次 | ||||||
? | 匹配0次或者一次,可有可无,最多只能有一个 | ||||||
{} | 精确定匹配次数,或者范围 | ||||||
[] | 常用来制定一个字符集,如[ab]匹配 a 或b;其他的元字符在[]中不起作用,除了【-】【^】 | ||||||
| | 或 | ||||||
() | 分组第一个组号为1 | ||||||
\ | 转译 |
\d | 匹配任何十进制数;它相当于类 [0-9]。 | ||||||
\D | 匹配任何非数字字符;它相当于类 [^0-9] | ||||||
\s | 匹配任何空白字符;它相当于类 [ \t\n\r\f\v] | ||||||
\S | 匹配任何非空白字符;它相当于类 [^ \t\n\r\f\v] | ||||||
\w | 匹配任何字母数字字符;它相当于类 [a-zA-Z0-9_] | ||||||
\W | 匹配任何非字母数字字符;它相当于类 [^a-zA-Z0-9_] | ||||||
\b | 匹配一个单词边界,也就是指单词和空格间的位置 |
标签:
原文地址:http://www.cnblogs.com/jl-bai/p/5498326.html