Shell的本质是对系统传达一系列的命令或者信号,其表现形式通常都是某个命令加上一大串的字符。这一串字符就是用来表达意义的字符,也就是正则表达式。正则表达式的最基本元素是元字符,它们是用来描述字符的字符,用途是对字符表达内容、解释以及各种操作信息进行描述。
Linux Shell本身不支持正则表达式,必须使用各种Shell命令和工具来实现,这里主要介绍正则表达式的组成和各个元字符的意义。
#正则表达式的用途
正则表达式通常用在查询或者查找某一类文件中,对不满足表达式条件的信息进行过滤,输出与表达式匹配的信息或者数据。
#正则表达式的基本元素
正则表达式的基本元素包含普通字符和元字符
普通字符:即普通的字符,包含字母、数字等,其中字母是区分大小写的。
元字符:主要包含*、.、^、[]、$、\、\<\>等赋予特殊作用的字符。
#元字符的作用
* 用于匹配前面一个普通字符的0次或者多次重复
如 wo*f 可以表示woof也可以表示wooooof等
. 用于匹配任意字符,如果有有多个字符,可以连续使用用多个.符号
如 .he 可以表示she也可以表示ahe、bhe等,如果有多个字符可以表示为...he
表示he前面有三个字符
^ 用于表示行首匹配,即行首的字符是”^”后面的字符,可以是一个或者多个
如 ^txt 表示以txt开头的行
[] 为匹配符号集,支持穷举法列出的字符集合的所有元素,同时支持用“-”表示字
集范围,范围为“-”左边到右边的字符范围。
如 [0123456] 表示匹配0到6的任意一个数字,也可以表示为[0-6]
$ 用于表示行尾匹配,即行尾的字符是 $ 前面的字符,可以是一个或者多个
如 txt$ 表示以txt为行尾的行,这里要注意,元字符的位置与行首匹配是相反的。
\ 定义转义符,作用是屏蔽一个元字符的特殊意义,即”\”后面的字符不再有特殊意义,只是普通的字符。
\<\> 精确匹配符,其形式为\<要匹配的内容\>。作用是输出精确匹配的结果。
如 \<a.txt\> 则只会输出a.txt,其他无论是包含a还是包含txt的结果都不会输出。
\{\} 系列匹配符,其有三种形式,如下。
\{n\} 匹配前面字符出现n次的结果
如hel\{1\}o 表示重复l一次,即匹配结果为hello
\{n,\} 匹配前面字符至少出现n次的结果
如 hel\{3,\}o,则匹配结果为hellllo
\{n,m\} 匹配前面字符出现n到m次的结果
如 hel\{1,3\}o,则输出结果为hello、helllo、hellllo。
除了以上列出的正则表达式的元字符外,其实还有一些扩展元字符,通常用的比较少。
#帮助信息:
#Edit By Lion @2015/07/30
#QQ:2022215673
#Mail:simy_88@163.com
本文出自 “精华荟萃” 博客,请务必保留此出处http://simy88.blog.51cto.com/7370552/1680334
原文地址:http://simy88.blog.51cto.com/7370552/1680334