码迷,mamicode.com
首页 > 其他好文 > 详细

基本正则表达式grep应用

时间:2014-05-11 19:21:06      阅读:240      评论:0      收藏:0      [点我收藏+]

标签:正则表达式   过滤   逻辑   grep   元字符   

前言

   正则虐我千百遍,我待正则如初见。 ——煌朝

xxx:grep 水很深 ;

xxx:grep 水不深 正则表达式深;

xxx:水都深,我已经淹死在里面了;

xxx:正则 是永远都填不完的坑;

以上是同学们对于正则表达式的积极讨论结果。


一、那么被大家视如洪水猛兽的正则表达式到底是什么呢,

   1.  从概念上讲,正则表达式是对字符串操作的一种逻辑公式,就是要事先定义好的一些特定字符、及这些特字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种逻辑过滤。

   2.  简单来讲,就是用几个特定字符快速过滤出我们想要得到和看到的内容能够,跟像是添加查询条件。


二、我们为什么要学习正则表达式呢

   1.  正则表达式的灵活性,逻辑性和功能性非常的强

   2.  可以通过正则表达式,从字符串中获取我们想要的特定部分

   3.  可以迅速的用极简单的方式表达到字符串的复杂控制。


三、正则表达式元字符[pattern]

   1.^:锚定行首符合条件的内容  "^pattern"

   2.   $:锚定行为符合条件的内容  "pattern$"

               "^pattern$" 锚定pattern

               "^$"  表示锚定空白行

   3.  \?:匹配其前面字符0次或1次

   4.  \{m,n\}:匹配其前面字符至少m次,至多n次

   5.  \{0,n\}:匹配其前字符至多n次

   6.  \{m,\}:匹配器前面字符至少m次

   7.  \{m\}:精确匹配m次

   8.  \<:锚定词首,用法格式:\<pattern  

                等同于\b: \bpattern  匹配以pattern开头的单词

   9.  \>:锚定词尾,用法格式:pattern\>  

                等同于\b:pattern\b 匹配以pattern结尾的单词

   10. \<pattern\>   匹配单词pattern

   11. \(\):分组,用法格式:\(pattern\)  

                 \(ab\)\{1,3\}  匹配ab出现1-3次

   12. \(a.b\).*\1  匹配“a.b任意字符a.b”  1表示多个括号时引用第一个括号内的内容


   13. .:匹配任意单个字符

   14. *:匹配紧挨其前字符任意次,可以不出现

   15. .*:匹配任意范围任意长度字符

   16. []:匹配指定范围内的任意单个字符

   17. [^]:匹配指定范围外的任意单个字符


   18.  [:space:]空白字符  

   19.  [:digit:]任意数字  [[:digit:]]=[0-9]

   20.  [:lower:]小写字母  [[:lower:]]=[a-z]

   21.  [:upper:]大写字母

   22.  [:alpha:]所有字母

   23.  [:alnum:]所有数

   24.  [:punct:]所有符号


四、grep

   1.  grep语法

            grep [pattern][文件或目录...]

   2.  grep的选项

             --color=auto    #过滤出字体添加默认颜色

             export GREP_COLOR=‘01;36‘   #改变字体默认颜色

                 -o 只显示匹配到的内容

                 -v 反向选取,只显示不符合模式的行

                 -i 不区分大小写

                 -A #显示匹配到的行时,顺带显示其后面的#行

                 -B #显示前面的#行

                 -C #显示前面和后面的#行

                 -E 使用扩展的正则表达式

                 -r 递归搜索,可以在目录及子目录中同时搜索


注:我理解grep跟正则表达式的关系

   正则表达式是一种表达式,是一种逻辑;grep是支持正则表达是的一个命令,一种工具

五、光看元字符和grep选项是不是已经看蒙圈了呢,下面我们举些例子简单说明下:


1.  找出/proc/meminfo文件中以不区分大小写的s开头的行;

     [root@localhost ~]# grep --color=auto -i "^[s]" /proc/meminfo

     解释:--color=auto 给过滤出的字体加默认颜色,-i表示不区分大小写,""里面表示过滤内容

2.  找出/etc/passwd中以nologin结尾的行

     [root@localhost ~]# grep --color=auto "nologin$" /etc/passwd

     解释:""中写需要过滤内容,$表示以前面的内容做为行尾,也可以加-o 只显示过滤内容

3.  找出/etc/rc.d/rc.sysinit中以#开头,且后面跟了空白字符,而后又跟了任意非空白字符的行

     [root@localhost ~]# grep "^#[[:space:]][^[:space:]]*" /etc/rc.d/rc.sysinit

     解释:^#以“#”开头,[[:space:]],表示一个或多个空白字符,[^[:space:]]非空白字符

4.  找出/etc/passwd中以一个字母开头,并且以开头字母结尾的行

     [root@localhost ~]# grep --color=auto "\(^[a-z]\).*\1$" /etc/passwd

     解释:前面的\(..\)表示括号内的内容为一个选定词,后面\1表示引用第一个()内的词


本文出自 “滴不尽相思血泪抛红豆” 博客,请务必保留此出处http://beijgh.blog.51cto.com/8272564/1409372

基本正则表达式grep应用,布布扣,bubuko.com

基本正则表达式grep应用

标签:正则表达式   过滤   逻辑   grep   元字符   

原文地址:http://beijgh.blog.51cto.com/8272564/1409372

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!