re 模块，正则表达式 \w+\d+ 的重复问题引发的题目解析

时间：2019-05-01 18:47:44 阅读：127 评论：0 收藏：0 [点我收藏+]

题目

计算以下代码的结果

s = "?!.18)dajslj$12.15613sdadw.123sdasda35615.168sndsda$15.6sdasd.sdfsdgw123.156s"

p1 = re.compile("\w+\.\w+\d+\.+\d+")
print(p1.findall(s)) 

p1 = re.compile("(\w+)\.(\w+)((\d+)\.+\d+)")
print(p1.findall(s))

答案

# [‘3265sdadw.sdasda35615.168‘, ‘6sdasd.sdfsdgw123.156‘]

# [(‘3265sdadw‘, ‘sdasda3561‘, ‘5.168‘, ‘5‘), (‘6sdasd‘, ‘sdfsdgw12‘, ‘3.156‘, ‘3‘)]

解析

本题考查正则分组优先原则以及输出格式

附带考查 \w+ \d+ 重复匹配问题

思考

第一个 \d+ 为什么匹配到的是 5？不应该是 35615吗？

如果是认为是 35615 应该是产业以下两种分析方式

方式一

技术图片

很明显 \w+ 可以匹配数字字母下划线所以后面的 35615 都是属于 \w+ de 匹配范围，所以这个分析方式绝对是错的

方式二

技术图片

这个分析方式已经基本上都对了，但是在 \w+\d+ 一起对数字的处理的时候，是使用的最小回退，即值给一位给 \d+ 所以不会全部把35615给他

正确方式

技术图片

最开始的"12" 为什么不会被 \w+ 匹配成功？

技术图片

看起来这样子匹配是可以的，貌似。

但是第二个 \w+\d+ 是链接在一起的，即是要求必须\w+后面有数字，因此 \w+\d+、就只能匹配到 15313，然后就没小数点就没办法匹配下去了。

所以是匹配不成功的。

re 模块，正则表达式 \w+\d+ 的重复问题引发的题目解析

标签：要求输出 span 划线模块必须产业结果 dfs

原文地址：https://www.cnblogs.com/shijieli/p/10800304.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

re 模块， 正则表达式 \w+\d+ 的重复问题引发的题目解析

题目

答案

解析

思考

第一个 \d+ 为什么匹配到的是 5？ 不应该是 35615吗？

方式一

方式二

正确方式

最开始的"12" 为什么不会被 \w+ 匹配成功？

re 模块，正则表达式 \w+\d+ 的重复问题引发的题目解析

第一个 \d+ 为什么匹配到的是 5？不应该是 35615吗？