码迷,mamicode.com
首页 > 编程语言 > 详细

用python的re(正则表达式)模块匹配英文环境下的括号

时间:2018-09-24 00:33:44      阅读:292      评论:0      收藏:0      [点我收藏+]

标签:环境   有一个   ssi   解答   问题   括号   一个   ror   正则表达式   

在用re(正则表达式)模块匹配掉文本中的括号时,总是出现各种各样的问题,经过将近一个小时的摸索,终于找到了问题的所在。

 案例:

将 txt = ‘Linux系统安装 - 1.1(Av20994127,P1).Flv‘ 中的(Av20994127,P1)匹配出来,再用re.sub()去掉。

初次尝试:

import re

tx = re.search(‘.*?(\(.*?\)).Flv‘, txt)

re.sub(tx.group(1), ‘‘, txt)

Out[1]: ‘Linux系统安装 - 1.1().Flv‘    # 括号()仍在,无法去掉。

 

解决方案:

import re

tx = re.search(‘.*?(\(.*?\)).Flv‘, txt)

re.sub(‘\(‘+tx.group(1)+‘\)‘, ‘‘, txt)        # 在tx.group(1) 前后分别加上 ‘\(‘ 与 ‘\)‘

                                                         # 由于才疏学浅,具体原理不明,如有高人路过,还望解答。

Out[2]: ‘Linux系统安装 - 1.1.Flv‘    # 括号()被去掉。

 

进阶:

当文本中只有一个括号(单括号)时,即:text = ‘Linux系统安装 - 1.1(Av20994127,P.Flv‘

用相同的方法,出现 error: missing ), unterminated subpattern 的错误。

经摸索发现,解决方案如下:

import re

text = ‘Linux系统安装 - 1.1(Av20994127,P.Flv‘

result = re.search(‘.*?(\(.*?,P),Flv‘, text)

new = re.sub(‘\\‘ + result.group(1), ‘‘, text)   # 在result.group(1)前面加 ’\\‘

Out[3]: ‘Linux系统安装 - 1.1.Flv‘

 

用python的re(正则表达式)模块匹配英文环境下的括号

标签:环境   有一个   ssi   解答   问题   括号   一个   ror   正则表达式   

原文地址:https://www.cnblogs.com/xiangsui/p/9693886.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!