标签:re模块 hello span int 百度 div 检索 asd 文本
个人对其的理解:按照一定规则,从某个字符串中匹配出想要的数据。
标准的解释:正则表达式,又称规则表达式。(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。 -------百度百科
text = "hello"
retext = re.match("he",text)
print(retext.group())
可以在 text 匹配出 he。
1.只可以顺着匹配,即若开头不是 he,会报错。
2. .group()将匹配到的类型转换成可以读文本。
text = "+hello"
ret = re.match(".",text)
print(ret.group())
匹配出 + 。
text = "0+35"
ret = re.match(‘\d‘,text)
print(ret.group())
text = "+"
ret = re.match(‘\D‘,text)
print(ret.group())
text = " \nab "
ret = re.match(‘\s‘,text)
print(ret.group())
text = ‘a‘
ret = re.match(‘\w‘,text)
print(ret.group())
text = ‘++a‘
ret = re.match(‘\W‘,text)
print(ret.group())
text = ‘0731-8888888‘
ret = re.match(‘[\d\-]‘,text)
print(ret.group())
其中 [\d\-] 表示匹配 \d (数字0-9)或者 匹配 -。第二个 \ 表示转义。
1).用中括号代替\d:
text = ‘+09asd+-sad/+‘
ret = re.match(‘[0-9]‘,text)
print(ret.group())
2).用中括号代替\D:
text = ‘+09asd+-sad/+‘
ret = re.match(‘[^0-9]‘,text)
print(ret.group())
3).用中括号代替\w:
text = ‘A+09asd+-sad/+‘
ret = re.match(‘[a-zA-Z0-9_]‘,text)
print(ret.group())
4).用中括号代替\W:
text = ‘+09asd+-sad/+‘
ret = re.match(‘[^a-zA-Z0-9_]‘,text)
print(ret.group())
其中 ^ 表示取非符号。
标签:re模块 hello span int 百度 div 检索 asd 文本
原文地址:https://www.cnblogs.com/zyde-2893/p/11184037.html