python正则表达式

时间：2018-10-16 22:05:06 阅读：219 评论：0 收藏：0 [点我收藏+]

python正则表达式的用途不过多赘述

python正则表达式的实现主要是通过python的re库，re库是python的标准库，所以无须安装

1.正则表达式的常用操作符

2.re库的使用

主要功能函数

函数	说明
re.search()	在一个字符串中搜索匹配正则表达式的第一个位置，返回match对象
re.match()	从一个字符串的开始位置起匹配正则表达式，返回match对象
re.findall()	搜索字符串，以列表类型返回全部能匹配的子串
re.split()	将一个字符串按照正则表达式匹配结果进行分割，返回列表类型
re.finditer()	搜索字符串，返回一个匹配结果的迭代类型，每个迭代元素是match对象
re.sub()	在一个字符串中替换所有匹配正则表达式的子串，返回替换后的字符串

例如：

re.search(pattern,string,flags=0)

其中：

常用标记	说明
re.I re.IGNORECASE	忽略正则表达式的大小写，[A‐Z]能够匹配小写字符
re.M re.MULTILINE	正则表达式中的^操作符能够将给定字符串的每行当作匹配开始
re.S re.DOTALL	正则表达式中的.操作符能够匹配所有字符，默认匹配除换行外的所有字符

>>> import re
>>> m = re.search(r‘[1-9]\d{5}‘, ‘abc1234567‘)
>>> if m:
...     m.group(0)
...
‘123456‘

还有一种写法是这样的

>>> import re
>>> t = re.compile(r‘[1-9]\d{5}‘)
>>> m = t.search(‘abc1234567‘)
>>> if m:
...     m.group(0)
...
‘123456‘

第二种写法的好处是：当要对一个正则表达式进行多次字符串匹配时，可以只编译一次，匹配多次，可以提升效率

3.Match对象

4.re库的贪婪匹配

Re库默认采用贪婪匹配，即输出匹配长的子串

例如

>>> match = re.search(r‘PY.*N‘, ‘PYANBNCNDN‘) 
>>> match.group(0) 
‘PYANBNCNDN‘

那么，如何输出最小的匹配呢

可以在.*后面加个?，就像这样

>>> match = re.search(r‘PY.*?N‘, ‘PYANBNCNDN‘) 
>>> match.group(0) 
‘PYAN‘

还有一些其他的操作符

-------------完

原文地址：https://www.cnblogs.com/tcctw/p/9800303.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

周排行