码迷,mamicode.com
首页 > 系统相关 > 详细

linux正则表达式和扩展表达式

时间:2015-08-29 01:00:27      阅读:269      评论:0      收藏:0      [点我收藏+]

标签:linux正则表达式

                            Centos的grep的正则表达式和扩展表达式

日期2015.08.28 备注:其简述来自于马哥课堂笔记

 grep

     grep是一个文本过滤工具根据用户指定的“模式(pattern)”逐行去搜索目标文本,打印匹配到的行;
     模式:由正则表达式的元字符及文本字符所编写的过滤条件;

     其中,元字符:字符不表示其字面意义,而用于表示通配或控制功能

     grep分为两类

            基本的正则表达式:BRE

            扩展的正则表达式:ERE

      grep 使用格式

      grep  [选项]   模式  [文件]

     其常用选项有

--color=auto:对匹配到的串做高亮显示; 备注:--color 默认的命令别名中已经定义了grep=grep --color了

 技术分享

加上--color

技术分享

-v:显示模式匹配不到行;

技术分享

 -i: 忽略字符大小写;

技术分享

 -o: 仅显示能够被模式匹配到的字符串;

技术分享

-q: 静默模式,匹配到什么也不显示。

技术分享

 -E:使用扩展的正则表达式;这里就不发图了后面有演示。  

  基本正则表达式的元字符:
 字符匹配:
 .: 匹配任意单个字符;

技术分享

[]:匹配指定范围内的任意单个字符;下图中[a-z]和[a-c]匹配字符就不一样,因为字符范围不同

技术分享

 [^]:匹配不在指定范围内的任意单个字符;

技术分享

[:lower:]:小写字母

技术分享

[:upper:]:大写字符

技术分享

[:space:]:空白字符

技术分享

[:punct:]:标点符号

技术分享

[:alpha:]:大小写字母;意思是所有的字母不分大小写

技术分享

[:digit:]:数字

技术分享

次数匹配:用于要指定其次数的字符的后面,表示指定其前面的字符

*: 任意次

\?:0或1次

\+:1或多次
\{m\}:精确限制为m次
\{m,n\}: 至少m次,至多n次,[m,n]
\{0,n\}:至多n次,少了可以没有
\{m,\}:至少m次,多则不限
.*: 匹配任意长度的任意字符

以上命令总结如下图:

技术分享

             位置锚定:
 ^: 行首锚定;用于模式的最左侧;

技术分享

 $: 行尾锚定;用于模式的最右侧; 注意,在Centos7后$来锚定行尾的时候要使用单引号。

技术分享

 \<, \b: 词首锚定;用于表示单词的模式的左侧;

技术分享

 \>, \b:词尾锚定;用于表示单词的模式的右侧;

技术分享

 ^$: 空白行;我们使用管道和wc -l 来统计匹配到的空白行 如下图:

技术分享

 分组:\(\)
     分组的小括号中的模式匹配到的内容,会在执行过程中被正则表达式引擎记录下来,并保存内置的变量      中;这些变量分别是\1, \2, ...
   \1: 从左侧起,第一个左括号,以及与之配对的右括号中间的模式所匹配到的内容;
    \2: 从左侧起,第二个左括号,以及与之配对的右括号中间的模式所匹配到的内容;                    ...
    后向引用:使用变量引用前面的分组括号中的模式所匹配到的字符;

技术分享

   扩展的正则表达式:

         grep家庭有三个命令:
               grep:基本正则表达式
                -E: 扩展正则表达式
                -F:不支持正则表达式
                egrep:扩展正则表达式
                fgrep:不支持正则表达式

          扩展正则表达式的元字符

               字符匹配:
                   .: 任意单个字符
                   []:指定范围内的任意单个字符
                   [^]:不在指定范围内的任意单个字符
               次数匹配:

                  .*:匹配任意字符

                   *:匹配任意字符
                   ?:0次或1次;
                   +:1次以上;
                   {m}:精确匹配m次;
                   {m,n}:至少m次,至多n次;

                   {0,n}:至多n次,少了可以没有
                   {m,}:至少m次,多则不限

               位置锚定:
                   ^: 锚定行首
                   $: 锚定行尾
                   \<, \b:词首锚定;用于表示单词的模式的左侧;               

                   \>, \b:词尾锚定;用于表示单词的模式的右侧;

                   ^$: 空白行
               分组:()
                   后向引用:\1, \2, ...

以上扩展正则表达式和正则表达式使用方法差不多在这里就不一一截图了。

               或者:
                   a|b
                    C|cat: 不表示Cat或cat,而表示C或cat;
                    要写成(C|c)at



 说了那么多我们还是一起来做写练习吧!

 使用正则表达式和扩展表达式实现以下功能:

 1、显示/etc/passwd文件中以bash结尾的行;

  答案如下图:                 

技术分享

技术分享

扩展表达式则是,如下图:

技术分享

2、显示/etc/passwd文件中的两位数或三位数;如下图

技术分享

扩展表达式,如下图:

技术分享

3、显示‘netstat -tan‘命令结果中以‘LISTEN’后跟0个、1个或多个空白字符结尾的行;如下图:

技术分享

扩展表达式 如下图:


技术分享

4、添加用户bash,testbash, basher以及nologin用户(nologin用户的shell为/sbin/nologin),并找出    shell和用户一样的用户 2图、

太晚了,明天继续写

       

              使用扩展正则表达式实现以下功能

                    1、显示当前系统上root、centos或user1用户的默认的shell和UID;
                    2、找出/etc/rc.d/init.d/functions文件中某单词(单词中间可以存在下划线)后面跟着一组小括号的行;
                    3、使用echo输出一个路径,而后egrep找出其路径基名;
                         进一步地:使用egrep取出其目录名;
                    4、找出ifconfig命令执行结果中1-255之间的数字;

                      

本文出自 “IT-style” 博客,请务必保留此出处http://huichengu.blog.51cto.com/2495968/1689431

linux正则表达式和扩展表达式

标签:linux正则表达式

原文地址:http://huichengu.blog.51cto.com/2495968/1689431

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!