码迷,mamicode.com
首页 > 其他好文 > 详细

《正则表达式必知必会》

时间:2015-05-28 00:17:19      阅读:113      评论:0      收藏:0      [点我收藏+]

标签:

  1. 正则表达式(regular expression, 简称RegEx)
  2. 用途:查找替换
  3. 多个匹配结果:绝大多数正则表达式引擎的默认行为是只返回第1个匹配结果
  4. .只能匹配\n外的任何单个字符
  5. WANRING:验证某个模式不能获得预期的结果并不困难,但如何验证它不会匹配到你不想要的东西可就没那么简单了。
  6. -(连字符)是一个特殊的元字符,作为元字符它只能在[和]这间。在字符集合以外的地方,-只是一个普通的字符,只能与-本身相匹配。因此,在正则表达式里,-字符不需要被转义
  7. DOS和Windows文件路径用‘\‘,一行的结束标签为‘\r\n‘
  8. Linux和Unix中文件路径用‘/‘,一行的结束标志为‘\n‘,通常表示为$
  9. 元字符说明
    [\b]回退(并删除)一个字符(Backspace)
    \f换页符
    \n换行符
    \r回车符
    \t制表符(Tab键)
    \v垂直制表符

  10. 字符集[]中的字符除^-外,都表示本身
    1. 例:[.]将匹配.字符
  11. 表 常用的贪婪型元字符和他们的懒惰型
    贪婪型元字符                                      懒惰型元字符
            *                                                             *?
            +                                                            +?
         {n, }                                                           {n,  }?                                                                                                                                                                                              

  12. 回溯引用匹配
        1. 例:<[hH]([1-6])>.*?</[hH]\1>
        2. \1代表模式里的第1个表达式(\2代表第2个\3代表第3个)
        3. 回溯引用避免前后不一致的匹配出现,如<h1>XX</h2>
  13. 替换正则表达式里只有$是元字符
        1. 例     查找表达式(\w+[\w\.]*@[\w\.]+\.\w+)       
        2. 替换表达式   <A HREF = "mailto:$1">$1</A>
        3. 例     查找表达式(\s{3})(-)(\d{3}(-)(\d{4})
        4. 替换表达式    ($1)$3-$5    (其中的()不是元字符)
  14. 回溯引用条件:回溯引用条件只在一个前面的子表达式搜索成功的情况下才允许使用一个表达式
        1. 例:
        2. (<[Aa]\s+[^>]+>\s*)?<[Ii][Mm][Gg]\s+[^>]+>(?(1)\s*</[Aa]>)




《正则表达式必知必会》

标签:

原文地址:http://www.cnblogs.com/codetravel/p/4534630.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!