grep

时间：2015-02-04 00:53:05 阅读：222 评论：0 收藏：0 [点我收藏+]

标签：二进制字符串表达式

基本正则表达式

正则表达式学习，主要是对正则表达式元数据的学习。正则表达式本身没有什么高深的东西，本文仅仅对基本正则表达式的元数据进行一下总结：

. 匹配任意一个字符。

例如：grep –n ‘e.e’ regular.txt

匹配e和e之间有任意一个字符，可以匹配eee，eae，eve，但是不匹配ee。

转义字符。

例如：搜寻’，’是一个特殊字符，在正则表达式中有特殊含义。必须要先转义。

grep [-acinv] [--color=auto] [-A n] [-B n] ‘搜寻字符串‘ 文件名

参数说明：

-a：将二进制文档以文本方式处理

-c：显示匹配次数

-i：忽略大小写差异

-n：在行首显示行号

-A：After的意思，显示匹配字符串后n行的数据

-B：before的意思，显示匹配字符串前n行的数据

-v：显示没有匹配行-A：After的意思，显示匹配部分之后n行-B：before的意思，显示匹配部分之前n行

--color：以特定颜色高亮显示匹配关键字

一般习惯先输入 # alias grep=’grep –color’ =auto

来使得后续输入简便，仅输入grep便可获得 –color的效用

‘搜寻字符串’是正则表达式，注意为了避免shell的元字符对正则表达式的影响，请用单引号（’’）括起来，千万不要用双引号括起来（”）或者不括起来。

基本正则表达式

字符匹配：

. 用于匹配任意单个字符

[] 匹配指定集合中的任意单个字符

[[digit]],[0-9]

[[lower]],[a-z]

[[upper]],[A-Z]

[[alpha]],[a-zA-Z]

[[alnum]],[0-9a-zA-Z]

[[space]],[所有空白字符]

[[punct]],[所有特殊字符]

[^]匹配指定集合外的任意单个字符

匹配次数：用于实现对这个字符前面紧邻着字符所能够出现的次数做出限定

：匹配其前面的字符任意次，0，1或多次

例如：grep‘xy‘

xy，sy，aby，abc中xy，sy，aby能被匹配到，abc不能

贪婪模式，能匹配多次就匹配多长，越多越好

：匹配其前面的字符0次或1次；

例如：grep ‘xy‘

xy，xxy，y，xxxxxy，aby

+：匹配其前面的字符至少1次

{m}：匹配其前面的字符m次；

例如：grep ‘x{2}y‘

xy,xxy,y,xxxxy,aby, 只有xxy，和xxxxy的后面两个x会被匹配

{m,n}：匹配其前面的字符至少m次，至多n次；

grep ‘x{2，}y‘至少两次

.：匹配任意长度的任意字符

位置锚定符：

^：行首锚定

必须出现在模式的最左侧

$：行尾锚定

必须写在模式的最右侧

^&：空白行

：词首锚定

出现在要查找的单词模式的最侧：char

：词尾锚定

出现在要查找的单词模式的右侧：char

pattern：匹配单词

分组：

()

后向引用：模式中，如果使用()实现了分组，在某行文本的检查中，如果()的模式匹配到了某内容，此内容后面的模式中可以被引用；

1,2,3

模式自左向右，引用第#个左括号以及与其匹配的右括号之间的模式匹配到的内容；

扩展正则表达式

grep一般情况下支持基本正则表达式，可以通过参数-E支持扩展正则表达式，另外grep单独提供了一个扩展命令叫做egrep用来支持扩展正则表达式，这条命令和grep -E等价。虽然一般情况下，基本正则表达式就够用了。特殊情况下，复杂的扩展表达式，可以简化字符串的匹配。

扩展正则表达式

扩展正则表达式就是在基本正则表达式的基础上，增加了一些元数据。

意义和范例

+ 重复前面字符1到多次。

例如：匹配god，good，goood等等字符串。

grep –nE go+d’ regular.txt

匹配0或1次前面的字符

例如，匹配gd，god

grep –nE ‘god’ regular.txt

或（or）的方式匹配多个字串

例如：grep –nE ‘godgood’ regular.txt

匹配god或者good。

() 匹配整个括号内的字符串，原来都是匹配单个字符

例如：搜寻good或者glad

grep –nE ‘g(oola)’ regular.txt

() 前面的字符重复0到多次。

例如匹配gle，gogle，google，gooogle等等

grep –nE ‘gogle’ regular.txt

egrep及扩展的正则表达式

扩展正则表达式的元字符：

字符匹配：

[]

[^]

匹配次数限定：

：不限次数

？：匹配其前面的字符0次或1次；

+：匹配其前面的字符至少1次

{m}：匹配其前面的字符m次；

{m，n}，{m，}，{0，n}

锚定：

, b

分组：

()

支持后向引用：1，2，3，...

或者：

ab：a或者b

abcd：ab或cd

a(bc)d：abd或acd

# grep -E ‘pattern‘ file...

# grep ‘pattern‘ file...

grep

标签：二进制字符串表达式

原文地址：http://9910189.blog.51cto.com/9900189/1611235

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行