码迷,mamicode.com
首页 > 其他好文 > 详细

正则匹配

时间:2017-09-29 17:52:23      阅读:140      评论:0      收藏:0      [点我收藏+]

标签:highlight   表示   正则   结束   port   style   reg   字符串   imp   

1.python中使用正则表达式的一般步骤

>>> import re
>>> phoneNumber=re.compile(r\d\d\d-\d\d\d-\d\d\d\d)
>>> mo=phoneNumber.search(My number is 415-555-4242)
>>> mo.group()

输出结果:415-555-4242

2.利用括号分组

>>> import re
>>> phoneNumRegex=re.compile(r(\d\d\d)-(\d\d\d-\d\d\d\d))
>>> mo=phoneNumRegex.search(My number is 415-555-5252.)
>>> mo.group(1)
415
>>> mo.group(2)
555-5252
>>> mo.group(0)
415-555-5252
>>> mo.group()
415-555-5252
>>> mo.groups()
(415, 555-5252)

正则表达式字符串中的第一对括号是第1组,第二组括号是第2组。向group()方法传入0或不传入参数,将返回整个匹配的文本。groups()返回多个值得元祖

3.如果正则表达式匹配括号就要加转义字符‘\’

>>> import re
>>> phoneNumRegex=re.compile(r(\d\d\d)-(\d\d\d-\d\d\d\d))
>>> phoneNumRegex=re.compile(r(\(\d\d\d\))-(\d\d\d-\d\d\d\d))
>>> mo=phoneNumRegex.search(My number is (415)-555-5252.)
>>> mo.group(1)
(415)
>>> mo.group(2)
555-5252

4用管道匹配多个分组

>>> import re
>>> batRegex=re.compile(rBat(man|mobile|copter|bat))
>>> mo=batRegex.search(Batmobile lost a wheel,the Batman found it)
>>> mo.group()
Batmobile
>>> mo.group(1)
mobile

方法调用mo.group()返回了完全匹配的文本‘Batmobile’,而mo.group(1)只是返回第一个括号分组内匹配的文本‘mobile‘

5贪心与非贪心匹配

python的正则表达式默认的是 贪心 的,这表示在有二义的情况下,它们会尽可能匹配最长的字符串。花括号的“非贪心”版本匹配尽可能最短的字符串,即在结束的花括号后跟着一个问号

>>> import re
>>> HaRegex=re.compile(r‘(ha){3,5}?‘)
>>> mo=HaRegex.search(‘hahahahahaha‘)
>>> mo.group()
‘hahaha‘

  

6findall()方法

search()返回的是一个Match对象,包含被查找字符串中的‘第一次’匹配的文本

findall()方法将返回一组字符串,包含被查找字符串中的所有匹配;如果在正则表达式中有分组,那么findall将返回元组的列表。每个元组表示一个找到的匹配,其中的项就是正则表达式中的每个分组的匹配字符串

>>> phoneNumRegex=re.compile(r‘(\d\d\d)-(\d\d\d)-(\d\d\d\d)‘)
>>> phoneNumRegex.findall(‘Cell:415-555-9999 work:212-555-0000.‘)
[(‘415‘, ‘555‘, ‘9999‘), (‘212‘, ‘555‘, ‘0000‘)]

 

正则匹配

标签:highlight   表示   正则   结束   port   style   reg   字符串   imp   

原文地址:http://www.cnblogs.com/du346568978/p/7611758.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!