标签:lag 提高 内容 ble mat 比较 设置 规则 字符
flags
import re
pattern = '\d\w'
string = '1e1r1s4w'
result = re.findall(pattern, string)
print(result)
# 结果是:['1e', '1r', '1s', '4w']
格式:match/search(pattern, string, flags)
import re
pattern = '\d\w'
string = '1e1r1s4w'
result1 = re.match(pattern, string)
print(result1)
print(result1.group())
result2 = re.search(pattern, string)
print(result2.group())
print(result2)
# 结果是:
# <re.Match object; span=(0, 2), match='1e'>
# 1e
# 1e
# <re.Match object; span=(0, 2), match='1e'>
search和match用法的区别:
match在匹配上默认在匹配结果前加上^,即必须以匹配规则作为开头,
search匹配没有这个要求,match相当于在search的匹配规则上加上^
python import re pattern = ‘\d\w\s‘ string = ‘%^2e 2343452322w 345a ‘ result = re.search(pattern, string) print(result) result1 = re.match(pattern, string) print(result1) # 打印结果: # <re.Match object; span=(2, 5), match=‘2e ‘> # None
sub()和subn()都用于替换字符串中的内容
返回值:替换后的字符串内容
pattern = '\w\d.{2}'
string = 'w2er 23wew2er1'
str1 = string.replace('ew', 'mm')
print(str1)
# 普通字符串的内容替换
result = re.sub(pattern, 'H', string, 2)
print(result)
result1 = re.subn(pattern, 'H', string, 2)
print(result1)
# subn()返回的结果是替换后的字符串和替换的次数组成的元组
# subn和sub的区别在于subn返回值是一个元组,并且元组中包括替换的次数,sub没有替换次数
'''
# 结果是:
w2er 23wmm2er1
H Hw2er1
('H Hw2er1', 2)
'''
split()用于字符串切割
import re
pattern = '\w\d.{2}'
string = 'w2er 23wew2er1'
result2 = re.split(pattern, string, maxsplit=2)
print(result2)
# 打印结果:['', ' ', 'w2er1']
import re
re_compile = re.compile(pattern)
# re.compile(匹配规则)获取的是通用的匹配规则模版,这个模版用于重复使用时来节省时间,但是单次使用时不会节省时间
print(re_compile)
result = re.search(re_compile, string)
print(result.group())
'''
结果是:
re.compile('\\w\\d.{2}')
w2er
'''
import re
pattern = '\w\d.'
string = 's3ed3de3shoihuiuhj;klnhjghcugiopi[;kbjd3sd2sf4sf5swsdfskghj3sj3sj4dja5s'
result = re.finditer(pattern, string)
print(result)
for i in result:
print(i.group())
'''
<callable_iterator object at 0x105f7afd0>
s3e
d3d
e3s
d3s
d2s
f4s
f5s
j3s
j3s
j4d
a5s
'''
所有空间效率的都伴随着时间效率的提高
分组优先:是在正则表达式中通过()来实现分组,当匹配的字符串后显示的不是全部匹配成功的字符串,
而只是匹配括号内匹配上的结果
import re
pattern = 'www\.(baidu|jinritoutiao)\.com'
# 当正则表达式中使用()进行分组后,通过findall()获取的结果是括号内匹配上的内容,而不是全部匹配上的内容
# 分组优先原则
string = 'www.baidu.com'
result = re.findall(pattern, string)
print(result)
pattern = 'www\.(?:baidu|jinritoutiao)\.com'
# 在括号中第一个位置加上?:可以取消分组优先,显示全部的内容
string = 'www.baidu.com'
result = re.findall(pattern, string)
print(result)
pattern = 'www\.baidu\.com|www\.jinritoutiao\.com'
# 普通的用法
string = 'www.baidu.com'
result = re.findall(pattern, string)
print(result)
'''
结果是:
['baidu']
['www.baidu.com']
['www.baidu.com']
'''
在split()切割中会把符合匹配的规则的字符切割掉,返回值中不包括这些内容,可以给正则表达式添加()使用分组优先原则
,使得切割的内容也在返回值中显示
pattern = '\d+'
string = 'alex100taibai20peiqi69'
result = re.split(pattern, string)
# 不使用分组优先原则切割掉的内容不会显示
print(result)
pattern = '(\d+)'
# 在正则中通过()使用分组优先的原则,可以在切割的时候把正常情况下切割掉的内容正常显示出来
string = 'alex100taibai20peiqi69'
result = re.split(pattern, string)
print(result)
'''
结果是:
['alex', 'taibai', 'peiqi', '']
['alex', '100', 'taibai', '20', 'peiqi', '69', '']
'''
当查询到结果后通过group()可以显示匹配到的字符,当pattern存在多个group()时,在返回的结果中可以通过group(num)来获取每一个group()匹配到的结果
group()中不写数字获取的是匹配的所有数据,当写1的时候获取的是第一个group匹配的内容,2获取的是第二个group匹配的内容,以此类推。
pattern = '\d(\.\d+)(\.\d+)(\.\d+)(\.\d+)(\.\d+)'
string = '1.2.3.4.5.6.7'
result = re.search(pattern, string)
print(result)
print(result.group())
print(result.group(1))
print(result.group(2))
print(result.group(3))
print(result.group(4))
print(result.group(5))
'''
结果是:
1.2.3.4.5.6
.2
.3
.4
.5
.6
'''
标签:lag 提高 内容 ble mat 比较 设置 规则 字符
原文地址:https://www.cnblogs.com/ddzc/p/12303483.html