正则表达式
1、导入模块
import re
使用match()方法进行匹配操作
result =re.match
如果这一步匹配到数据的话 可以使用group方法提取数据result.group()
2、匹配对象Match Object 具有group方法 用来返回字符串的匹配部分
3、表示字符:
4、表示数量
{m,n}最少出现m次 最多出现n次
5、表示边界
eg邮箱匹配中 163. 那个点需要用转译字符\转译一下
6、匹配分组
eg:改成正确的html格式
注:前面加个括号代表分组 后面用\1 代表对前面分组的引用
eg:通过名字匹配html标签
7、re 模块的其他用法
re.search() 这个是search是从字符串往后找直到找到跟规则匹配的为止(并且找的是第一个符合规则的)
re.findall() 返回的是一个列表 会把所有的符合条件的都找出来
re.sub() 把所有符合规则都替换掉
re.split() 分割 返回的是一个列表