码迷,mamicode.com
首页 > 编程语言 > 详细

python-正则表达式语法规范与案例

时间:2018-08-24 22:55:43      阅读:300      评论:0      收藏:0      [点我收藏+]

标签:案例   第一个字符   obb   技术   从后往前   col   解释   含义   color   

 

正则表达式的用于与案例分析

2018-08-24 21:26:14

【说明】:该文主要为了随后复习和使用备查,由于做了word比较,所以此处博文没有怎么排版,没放代码,以插入图片为主,

技术分享图片

 

  • 一、正则表达式之特殊字符

  • 
    技术分享图片
    

     

    
    

     

    注意:

    以下的案例中是match()匹配,match是要求从第一个字符开始匹配,所以,前边是有.*

  • 【1】^ 作用- 以b 开头匹配的结果

  • 技术分享图片

     

  • 【2】$ 作用-任意开头,以3结尾

  • 技术分享图片

    注意:下边这种是不行的,如果没有*号,就不表示多次了。

  • 技术分享图片

    表示4为匹配第三位的。点是匹配第二位的。

  • 【3】?的作用

  • (1)贪婪匹配默认是反向匹配的

    贪婪匹配下,是从后往前 开始匹配的。如下例子。

    技术分享图片

     

  • (2)、在左边加一个?号则正向匹配

  • 在左边 加一个?的话,就会从左往右开始匹配。是非贪婪匹配了,但是括号里面的仍然是贪婪匹配。【即从左匹配,第一个b被固定了,但是括号里的第二个b还是从右开始匹配,。*再输出中间的一切内容。】

  • 技术分享图片

    (3)、在括号里也添加括号,进行非贪婪匹配

  • 技术分享图片
    #技巧:括号里是有问好的,所以在第一个b 确定下后 .*?b是从左往右的
    # 输出是:boooooob
  • 【4】、+的作用

  • 简述以上?的原理

    其实,上边说的从左从右匹配都是一种技巧的规则,其实完全可以按照下边的这三个符号的含义来解释。

    *表示0次或者多次

    +表示1次或者多次

    ?0次或者是1次

  • 比如:

    Line=”booooooobbaaa”

    pattern=“.*(b.*b)”这里的两处.*都是贪婪匹配模式的,小括号中的.*【由于*是表示0/1次,】所以匹配出黄色部分的bb。

  • +的作用:

    +其实是表示1次或者是多次的匹配模式的。

    比如:对于以下

    Line=”booooooobbaaa”

    pattern=“.*(b.+b)”就无法匹配成功,因为.+是至少要匹配1个元素的,那么开头结尾都是b,中间还要一个元素的情况是没有的。

    那么比如:

    Line=”booooooobabaaa”

    pattern=“.*(b.+b)”

    就匹配出了结果是bab

  • 【案例分析】

  • (1)
  • 技术分享图片
  • (2)

     

  • 技术分享图片

    (3)

  • 技术分享图片

     

  • 【5】、{2}的作用、

    {1}  {2}  表示某一个限定元素的出现此时。

    案例分析:

  • (1)
  • 技术分享图片

    (2)

  • 技术分享图片

     

  • (3)
  • 技术分享图片

     

  • 【6】、{2,}&&{2,5}

  • 1、{2,}表示两次或以上的输出

  • 技术分享图片

    {2,5}

    Y与上边原理相同,表示,大于等于2 小于等于5

  • 技术分享图片

     

  • 【7】、| 的用法

  • 这个符号代表或的关系。

  • 技术分享图片

    特殊括号的用法

  • 技术分享图片

    输出boobb123

  • 【8】、[ ]的用法

  • 《1》[ ]第一个用法表示中括号中的任意一个值满足就进行匹配操作。

  • 案例如下:

  • 技术分享图片

    《2》[0-9]中括号的第二个含义,可以表示区间。

  • 比如说匹配电话号码:

    Phone_num_pattern=”1[3578][0-9]{9}”

    表示,可以匹配13*****  /15*****/17*************/18***********的电话号码,后边九位是0—9任意,{9}表示9个数字

  • 技术分享图片

    《3》[^1] 的第三个用法。表示中括号的值不是1 的所有情况匹配

  • 技术分享图片

    《4》[]的第四个用法 [.]中的.就表示一个点了。

  • 技术分享图片

     

  • 【9】、\s(小)表示可以匹配空格字符

  • \s 是匹配空白字符

  • 技术分享图片

    【10】、\S(大) 是匹配除了换行的任何非空白字符的

  • 技术分享图片

    如果您好中间有多个字符可以用 “(您\S+好)”进行匹配来完成

  • 技术分享图片

     

  • 【11】、\w 的用法  【重点】------是与\S(大)比较相似

  •  \w 的含义是[A-Za-z0-9_]    是与\S有区别的,比如\S是可以匹配到+号的

  • 技术分享图片

     

  • 【12】、\W 是表示除了[A-Za-z0-9_]之外的所有字符

  • \W 是表示除了[A-Za-z0-9_]之外的所有字符,它恰好与\w相反的一个匹配功能。

  • 技术分享图片

     

  • 【13】、Unicode汉字的提取

  • 提取代码是 [\u4E00-\u9FA5]+

  • 技术分享图片

     

  • 【14】、再次理解贪婪匹配

  • 技术分享图片

     

  • 【15】 \d 的用法 是提取出数字

  • 技术分享图片

     

  • 【16】、()表示一个组。

  • 总结:正则表达式汇总表

  • 技术分享图片
  •  

    总结案例:【经典案例】

  • 案例一:

  • 技术分享图片

    案例2 :

  • 技术分享图片

     

python-正则表达式语法规范与案例

标签:案例   第一个字符   obb   技术   从后往前   col   解释   含义   color   

原文地址:https://www.cnblogs.com/jiyongjia/p/9532223.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!