码迷,mamicode.com
首页 > 其他好文 > 详细

正则表达式匹配二次转义的东西 / 怎么处理?

时间:2018-09-06 16:21:57      阅读:157      评论:0      收藏:0      [点我收藏+]

标签:正则表达式   csdn   引擎   就是   hand   需要   遇到   tail   一点   

原来的源码里的数据大概是这么形式的
<div class=\"WB_handle W_fr\" mid=\"4170395588014391\">XXXXXX<em>XXXXXXX<\/em>.*?<\/div>
然后就死活出不来了
经过思考(其实是我之前好像遇到过,记忆模糊但随便试了试)写成下面这样的可以匹配到
<div class=\\\\"WB_handle W_fr\\\\" mid=\\\\"4170395588014391\\\\">.*?<em>(.*?)<\\\/em>.*?<\\\/div>

这里,我们可以看一下,我们这一个/用了////表示,但是后面的\\\/可以\\\\/可以\\\\\/也可以

找了一点资料 https://blog.csdn.net/zttaiwx/article/details/53981755

由此可见,在字符串中,两个反斜杠被解释为一个反斜杠,然后在作为正则表达式, \\ 则被正则表达式引擎解释为 \,所以在正则表达式中需要使用四个反斜杠。 
也就是说,前两个反斜杠在字符串中被解释为一个反斜杠,后两个也被解释为一个反斜杠,这时解释完毕后变成两个反斜杠,再由正则表达式解释两个反斜杠,就又解释成了一个反斜杠,所以,在正则表达式中要匹配一个反斜杠时,需要四个反斜杠。

同理,要匹配点号时,需要在点号之前加上两个反斜杠,否则将被正则表达式当作一个点号,一个点号在正则表达式中表示匹配任意字符了。

那么\\\/是两个\用来转义了  \\\\/则是\\\\视为一个\  而\\\\\/ 前四个视为一个\后面视为转义

目前是这么理解的,以后有待考验

正则表达式匹配二次转义的东西 / 怎么处理?

标签:正则表达式   csdn   引擎   就是   hand   需要   遇到   tail   一点   

原文地址:https://www.cnblogs.com/palace/p/9598426.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!