码迷,mamicode.com
首页 > 编程语言 > 详细

python 正则表达式

时间:2017-08-22 01:47:58      阅读:238      评论:0      收藏:0      [点我收藏+]

标签:实现   函数   等价   匹配   tutorial   one   正则表达式   信息   特殊   

正则表达式是由普通字符(例如字符 a 到 z)以及特殊字符(称为"元字符")组成的文字模式。

 

re.match只匹配字符串的开始,如果字符串开始不符合正则表达式(一句话中句首包含的特定字符),则匹配失败,函数返回None;而re.search匹配整个字符串(一句话中包含的特定字符),直到找到一个匹配

"."  匹配字符串中除 "\n" 之外的任何单个字符

" * "  通配符匹配文件名中零个或多个字符

"?"  通配符匹配文件名中的单个字符。匹配前面的子表达式零次或一次,例如:

"do(es)?" 可以匹配 "do" 或 "does" 中的"do" 。? 等价于 {0,1},(es)里面的内容匹配0到1次,[word]匹配字符w或o或r或d

 

“+”  匹配前面的子表达式一次或多次。例如,‘zo+‘ 能匹配 "zo" 以及 "zoo",但不能匹配 "z"。+ 等价于 {1,}

*,+和?限定符都是贪婪的,因为它们会尽可能多的匹配文字,只有在它们的后面加上一个?就可以实现非贪婪或最小匹配。

[^...]  不在[]中的字符:[^abc0-9] 匹配除了a,b,c和0到9之外的字符

" ^ "  匹配输入字符串开始的位置,不要将 ^ 的这种用法与中括号表达式内的用法混淆

a|b  匹配a或b

\W  匹配非字母数字

\d  匹配任意数字,等价于 [0-9]

\A  匹配字符串开始

\z  匹配字符串结束

\S  匹配任何非空白字符。等价于 [^ \f\n\r\t\v]

http://www.ziqiangxuetang.com:80/html/html-tutorial.html
/(\w+):\/\/([^/:]+)(:\d*)?([^# ]*)/

第一个括号子表达式捕获 Web 地址的协议部分。该子表达式匹配在冒号和两个正斜杠前面的任何单词。第二个括号子表达式捕获地址的域地址部分。子表达式匹配 / 或 : 之外的一个或多个字符。第三个括号子表达式捕获端口号(如果指定了的话)。该子表达式匹配冒号后面的零个或多个数字。只能重复一次该子表达式。最后,第四个括号子表达式捕获 Web 地址指定的路径和/或页信息。该子表达式能匹配不包括 # 或空格字符的任何字符序列
第一个括号子表达式包含"http"
第二个括号子表达式包含"www.ziqiangxuetang.com"  
第三个括号子表达式包含":80"  
第四个括号子表达式包含"/html/html-tutorial.html"

python 正则表达式

标签:实现   函数   等价   匹配   tutorial   one   正则表达式   信息   特殊   

原文地址:http://www.cnblogs.com/vickey-wu/p/7407266.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!