贪婪和非贪婪

时间：2018-10-20 23:43:40 阅读：165 评论：0 收藏：0 [点我收藏+]

标签：优先 reg 说明 ring test 正则 match 深度优先 body

贪婪匹配：当正则表达式中包含能接受到重复的限定符时，通常的行为是匹配尽可能多的字符，这中匹配方式叫做贪婪匹配。特征是一次性读入整个字符串经行匹配，每当不匹配就舍弃最右边一个字符，继续匹配，依次匹配和舍弃，直到匹配成功或者把整个字符串舍弃为止，因此它是一种最大化数据返回，能多不会少。

前面我们讲过重复限定符，其实这些限定符就是贪婪量词，比如表达式：\d{3,6}

用来匹配3到6位数字，在这种情况下，它是一种贪婪模式匹配，也就是假如字符串里有6个数字匹配，那它就会全部匹配到。

String test = "61762828 176 2991 871";
    String reg = "\\d{3,6}";
    Pattern pattern = Pattern.compile(reg);
    Matcher mc = pattern.matcher(test);
    while (mc.find()) {
        System.out.println("匹配结果:" + mc.group());
    }
    // 匹配结果:617628
    // 匹配结果:176
    // 匹配结果:2991
    // 匹配结果:871

由结果可见：本来字符串中的“61762828”这一段，其实只需要出现“617”就已经匹配成功了，但它并不满足，而是匹配到了最大能匹配的字符，也就是6个。

那么有人会问，如果多个贪婪量词凑在一起，那他们是如何支配自己的匹配权的呢？

是这样的，多个贪婪在一起时，如果字符串能满足他们各自最大程度的匹配时，就互不干扰，但如果不能满足时，会根据深度优先的原则，也就是从左到右的每一个贪婪量词，优先最大数量的满足，剩余再分配下一个量词匹配。

String test = "61762828 176 2991 87321";
    String reg = "(\\d{1,2})(\\d{3,4})";
    Pattern pattern = Pattern.compile(reg);
    Matcher mc = pattern.matcher(test);
    while (mc.find()) {
        System.out.println("匹配结果:" + mc.group());
    }
    // 匹配结果:617628
    // 匹配结果:2991
    // 匹配结果:87321

“617628” 是前面的\d{1,2}匹配出了61，后面的匹配出了7628

"2991" 是前面的\d{1,2}匹配出了29 ，后面的匹配出了91

"87321"是前面的\d{1,2}匹配出了87，后面的匹配出了321

懒惰（非贪婪）

懒惰匹配：当正则表达式中包含能接受重复的限定符时，通常的行为是匹配尽可能少的字符，这种匹配方式叫做懒惰匹配。特性：从左到右，从字符串的最左边开始匹配，每次试图不读入字符匹配，匹配成功，则完成匹配，否则读入一个字符再匹配，依次循环（读入字符，匹配）直到匹配成功或者把字符串的字符匹配完为止。

代码	说明
*？	重复任意次，但尽可能少重复
+？	重复1次或更多次，但尽可能少重复
？？	重复0次或1次，但尽可能少重复
{n,m}?	重复n到m次，但尽可能少重复
{n,}?	重复n次以上，但尽可能少重复

String reg = "(\\d{1,2}?)(\\d{3,4})";
    String test = "61762828 176 2991 87321";
    System.out.println("文本：" + test);
    System.out.println("贪婪模式：" + reg);
    Pattern p1 = Pattern.compile(reg);
    Matcher m1 = p1.matcher(test);
    while (m1.find()) {
        System.out.println("匹配结果：" + m1.group(0));
    }
    // 文本：61762828 176 2991 87321
    // 贪婪模式：(\d{1,2}?)(\d{3,4})
    // 匹配结果：61762
    // 匹配结果：2991
    // 匹配结果：87321

“61762” 是左边的懒惰匹配出6，右边的贪婪匹配出1762
"2991" 是左边的懒惰匹配出2，右边的贪婪匹配出991
"87321" 左边的懒惰匹配出8，右边的贪婪匹配出7321

贪婪和非贪婪

标签：优先 reg 说明 ring test 正则 match 深度优先 body

原文地址：https://www.cnblogs.com/zhangj-ymm/p/9823379.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行