标签:highlight 表示 正则 结束 port style reg 字符串 imp
1.python中使用正则表达式的一般步骤
>>> import re >>> phoneNumber=re.compile(r‘\d\d\d-\d\d\d-\d\d\d\d‘) >>> mo=phoneNumber.search(‘My number is 415-555-4242‘) >>> mo.group()
输出结果:415-555-4242
2.利用括号分组
>>> import re >>> phoneNumRegex=re.compile(r‘(\d\d\d)-(\d\d\d-\d\d\d\d)‘) >>> mo=phoneNumRegex.search(‘My number is 415-555-5252.‘) >>> mo.group(1) ‘415‘ >>> mo.group(2) ‘555-5252‘ >>> mo.group(0) ‘415-555-5252‘ >>> mo.group() ‘415-555-5252‘ >>> mo.groups() (‘415‘, ‘555-5252‘)
正则表达式字符串中的第一对括号是第1组,第二组括号是第2组。向group()方法传入0或不传入参数,将返回整个匹配的文本。groups()返回多个值得元祖。
3.如果正则表达式匹配括号就要加转义字符‘\’
>>> import re >>> phoneNumRegex=re.compile(r‘(\d\d\d)-(\d\d\d-\d\d\d\d)‘) >>> phoneNumRegex=re.compile(r‘(\(\d\d\d\))-(\d\d\d-\d\d\d\d)‘) >>> mo=phoneNumRegex.search(‘My number is (415)-555-5252.‘) >>> mo.group(1) ‘(415)‘ >>> mo.group(2) ‘555-5252‘
4用管道匹配多个分组
>>> import re >>> batRegex=re.compile(r‘Bat(man|mobile|copter|bat)‘) >>> mo=batRegex.search(‘Batmobile lost a wheel,the Batman found it‘) >>> mo.group() ‘Batmobile‘ >>> mo.group(1) ‘mobile‘
方法调用mo.group()返回了完全匹配的文本‘Batmobile’,而mo.group(1)只是返回第一个括号分组内匹配的文本‘mobile‘
5贪心与非贪心匹配
python的正则表达式默认的是 贪心 的,这表示在有二义的情况下,它们会尽可能匹配最长的字符串。花括号的“非贪心”版本匹配尽可能最短的字符串,即在结束的花括号后跟着一个问号
>>> import re >>> HaRegex=re.compile(r‘(ha){3,5}?‘) >>> mo=HaRegex.search(‘hahahahahaha‘) >>> mo.group() ‘hahaha‘
6findall()方法
search()返回的是一个Match对象,包含被查找字符串中的‘第一次’匹配的文本
findall()方法将返回一组字符串,包含被查找字符串中的所有匹配;如果在正则表达式中有分组,那么findall将返回元组的列表。每个元组表示一个找到的匹配,其中的项就是正则表达式中的每个分组的匹配字符串
>>> phoneNumRegex=re.compile(r‘(\d\d\d)-(\d\d\d)-(\d\d\d\d)‘) >>> phoneNumRegex.findall(‘Cell:415-555-9999 work:212-555-0000.‘) [(‘415‘, ‘555‘, ‘9999‘), (‘212‘, ‘555‘, ‘0000‘)]
标签:highlight 表示 正则 结束 port style reg 字符串 imp
原文地址:http://www.cnblogs.com/du346568978/p/7611758.html