python语言之正则

时间：2020-01-09 00:56:31 阅读：62 评论：0 收藏：0 [点我收藏+]

（一）正则表达式的构成
（三）Python正则模块之MatchObject

（一）正则表达式的构成

正则表达式由两种元素组成：

字面值
- 普通字符和
- 需要转义的字符（，^，$，.，|，?，*，+，()，[]，{}）
元字符（特殊意思）

.：除\n外的所有字符

\d：数字，等同于[0-9]

\D：匹配所有非数字 [ ^ 0-9]

\s：空白字符，\t\r\n\f\v

\S：非空白字符[ ^\t\r\n\f\v]

\w：字母数字字符[A-Za-z0-9_]

\W：字母数字字符[ ^A-Za-z0-9_]

|：yes|no

+:一次或者多次

?:一次或者0次

*：0次或者多次

{3,5}：3次到5次

{m}：m次

{m,}：最少m次

{，n}：最多n次
贪婪与非贪婪
- 非贪婪（两次后加？）
  
  .*?

边界匹配

^：行首

$：行尾

\b：单词边界

\B：非单词边界

\A：输入开头

\Z：输入结尾

?

?

（二）Python正则模块之RegexObject

模块：import re

RegexObject：编译后的正则表达式对象（编译为字节码并缓存re.compile），有利于重用

findAll方法

import re text = "Tom is 8 years old. Mike is 23 years old" pattern = re.compile('\d+') pattern.findall(text) ['8', '23'] >>> pattern = re.compile('[A-Z]\w+') >>> pattern.findall(text) ['Tom', 'Mike'] ---------------------------------------------------- s = '\\author:Kobe' pattern = re.compile('\\author') pattern.findall(s) []#p匹配不到 pattern = re.compile('\\\\author') pattern.findall(s) ['\\author'] pattern = re.compile(r'\\author') pattern.findall(s) ['\\author']

match(str,[,pos[,endpos]])方法，返回MatchObject：从开始的位置匹配，或指定从某个位置匹配，到哪个位置结束

pattren = re.compile(r'<html>') text = '<html><head></head><body></body></html>' pattren.match(text) <_sre.SRE_Match object; span=(0, 6), match='<html>'> text1 = ' <html><head></head><body></body></html>' pattren.match(text1) pattren.match(text1,1) <_sre.SRE_Match object; span=(1, 7), match='<html>'>

search(str,[,pos[,endpos]])方法任意位置搜索，返回MatchObject

text = "Tom is 8 years old. Mike is 23 years old" p1 = re.compile('\d+') p2 = re.compile('[A-Z]\w+') p1.match(text) p2.match(text) <_sre.SRE_Match object; span=(0, 3), match='Tom'> p1.search(text) <_sre.SRE_Match object; span=(7, 8), match='8'> p2.search(text) <_sre.SRE_Match object; span=(0, 3), match='Tom'>

finditer方法，类似于findAll，查找所有匹配项，返回一个可迭代对象

it = p1.finditer(text) for m in it: print(m) <_sre.SRE_Match object; span=(7, 8), match='8'> <_sre.SRE_Match object; span=(28, 30), match='23'>

（三）Python正则模块之MatchObject

text 'Tom is 8 years old. Mike is 23 years old' pattern = re.compile(r'(\d+).*?(\d+)') m = pattern.search(text) m <_sre.SRE_Match object; span=(7, 30), match='8 years old. Mike is 23'> m.group() '8 years old. Mike is 23' m.group(0) '8 years old. Mike is 23' #查看匹配的第一个分组 m.group(1) '8' #查看匹配的第二个分组 m.group(2) '23' #查看匹配的第一个分组的起始下标 m.start(1) 7 #查看匹配的第一个分组的结束下标 m.end(1) 8 #查看匹配的第一个分组的开始下标和结束下标 m.span(1) (7, 8) #查看匹配的第二个分组的起始下标 m.start(2) 28 #查看匹配的第二个分组的结束下标 m.end(2) 30 m.groups() ('8', '23') type(m.groups()) <class 'tuple'> ----------------------------------------------- text = 'i am a good teacher' pattern = re.compile('(\w+) (\w+)') pattern.findall(text) [('i', 'am'), ('a', 'good')] iter = pattern.finditer(text) for m in iter: print(m.group()) i am a good
python语言之正则
标签：iter type auth 输入 obj 空白组成 -- 位置
原文地址：https://www.cnblogs.com/gdy1993/p/12169172.html

踩

(0)

赞

(0)

举报

评论一句话评论（0）

登录后才能评论！

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

更多

Spring Cloud 从入门到精通（一）Nacos 服务中心初探 2021-07-29

基础的排序算法 2021-07-29

SpringBoot|常用配置介绍 2021-07-29

关于 .NET 与 JAVA 在 JIT 编译上的一些差异 2021-07-29

C语言常用函数-toupper()将字符转换为大写英文字母函数 2021-07-29

《手把手教你》系列技巧篇（十）-java+ selenium自动化测试-元素定位大法之By class name（详细教程） 2021-07-28

4-1 YAML配置文件注入 JavaBean中 2021-07-28

【python】用来将对象持久化的 pickle 模块 2021-07-28

马拉车算法 2021-07-28

用Python进行冒泡排序 2021-07-28