码迷,mamicode.com
首页 > 其他好文 > 详细

grep常用指令

时间:2016-06-24 22:17:04      阅读:482      评论:0      收藏:0      [点我收藏+]

标签:shell   正则表达式   grep指令   


一、grep 常用

grep [-acinv] ‘搜寻字符串‘ filename

参数说明:

-a :将 binary 档案以 text 档案的方式搜寻数据

-c :计算找到 ‘搜寻字符串‘ 的次数

-i :忽略大小写的不同,所以大小写视为相同

-n :顺便输出行号

-v :反向选择,亦即显示出没有 ‘搜寻字符串‘ 内容的那一行! 

1.搜索特定的字符 

grep ‘oo‘ pp.txt  以下仅仅用 pp 代表 pp.txt 

查看显示字符的行数  

grep -n ‘oo‘ pp  

查看非oo的字符 

grep -v ‘oo‘ pp

查看大小写忽略的字符

grep -i ‘oo‘ p 

2.利用[]处理搜索结果

查看 tast 和 test的字符串

grep -n ‘t[ae]st‘ pp  这里[ae]只当一个字符处理 a 或者是 e 这样就能匹配 上面的要求 

若是希望匹配 t(x)st 这个x是任意的字符的话,那么可以如下处理方式

grep ‘t[.]st‘ pp  .符号代表任意的字符

 

查看包含oo字符的信息

grep -n ‘oo‘ pp 

若是希望在oo之前没有g的字符信息

grep -n ‘[^g]oo‘ pp 这里的^就是取反的意思 非goo得字符 

取前面非字符的字符

grep -n ‘[^a-zA-Z]oo‘ pp  

得到数字的字符的话

grep -n ‘[0-9]‘ pp  // 其实这个等同于  grep -n ‘[0-9[0-9]*‘ pp * 代表0个或是多个重复的信息  

3.行首和行尾的特殊处理 $^ 

若是希望取得第一行是 the 开头的字符行

grep -n ‘^the‘ pp  

若是希望取得以英文字符开头的字符

grep -n ‘^[a-zA-Z]‘ pp 

取得不是以英文字符开头的信息

grep -n ‘^[^a-zA-Z]‘ pp   // 里面的^是取反 外面的^是以上面开头 

取得小数点结尾的行

grep -n ‘\.$‘ pp     //小数点是特殊字符 需要用\进行转义

注意在windows下 换行时 ^M 这个符号   

取得一个空行的方式

grep -n ‘^$‘ pp 这里就是取空行了

 

希望取得所有文档中非注释掉得内容的话 那么可如下

grep -v ‘^$‘ pp|grep -v ^#        第一个是取非空行的数据

第一个管道是取非#开头的数据

有时候更多的是取 #开头的行

grep -n ‘^#‘ pp 

4.任意字符和重复字符

. :绝对的任意字符

* :0个或是多个相同字符 

要查看gf中间是两个字符的数据

grep -n ‘g..f‘ pp 

至少有一个是o的字符串

grep -n ‘oo*‘ pp  //因为*代表0个或是多个 

以g开头和结尾,中间至少一个o

grep -n ‘goo*g‘  

查找gg中间是任意字符的字符串

grep -n ‘g.*g‘ pp 这里.就代表任意字符 

5.限定符 {}

查看g和p之间存在两个连个o的字符串

grep -n ‘go\{2,5\}p‘ 

查找至少两个的字符创

grep -n ‘go\{2,\}p‘ pp 

查找只有两个的字符串

grep -n ‘go\{2\}p‘ pp 

6.重要的特殊字符

 

^word待搜寻的字符串(word)在行首!

范例:grep -n ‘^#‘ pp 搜寻行首为 # 开始的那一行!  

word$待搜寻的字符串(word)在行尾!

范例:grep -n ‘!$‘ pp 将行尾为 ! 的那一行打印出来! 

.代表任意的一个字符

范例; grep -n ‘g.‘ pp 将是g开头的两个字符打印出来 

\将特殊字符转义

范例:grep -n \‘ pp  搜索有单引号的那一行 

*:匹配0个或是多个字符

grep -n ‘o*‘ pp 匹配拥有零个或是多个o的字符

\{n,m\} :匹配的个数

grep -n ‘o\{2\}‘ pp 打印出拥有两个oo的字符

[]匹配单个字符 

  1.[list] : [abl] 匹配 abl中任意一个

  2.[^xx]:对其中的字符进行取反  这里只能对的那个字符进行取反 若是希望是多个字符取反的话 还需要看看

  3.[char1-char2]:匹配某个范围之内的数据 例如 [a-z][A-Z][0-9]

7.扩张的grep --- > egrep  这个等同于 grep -E  

grep -v ‘^$‘ pp | grep -v ‘^#‘

通过egrep来表示就是

egrep -v ‘^$|^‘ 

8.查找内容有“或”的关系:

#查找数字为23或24的内容,并显示内容与行号

grep -E ‘23|24‘ * -n

 

9.查找data.txt文件有多少个空行:

grep ‘^$‘ data.txt -c 

10.查询当前目录中还有多少个目录:

ls -l | grep ^d‘

11.查找data.txt文件字符串尾部为a的内容

grep ‘a$‘ data.txt -i -n 

$ grep "sort it" *      (#或在所有文件中查询单词“sort it”)
接下来的所有示例是指在单个文件中进行查询
 行匹配
$ grep -c "48" data.f
$ 4          (#grep返回数字4,意义是有4行包含字符串“4 8”。)
$ grep "48" data.f          (#显示包含“4 8”字符串的4行文本)

显示满足匹配模式的所有行行数:
[lxj@localhost lxjwork]$ cat file

123bjk456

345yui678

789hiy123

[lxj@localhost lxjwork]$ grep -n 123 file

1:123bjk456

3:789hiy123

6. 精确匹配
[lxj@localhost lxjwork]$ cat file

123bjk456

345yui678

789hiy123

[lxj@localhost lxjwork]$ grep "123\>" file

789hiy123

7. 查询空行,查询以某个条件开头或者结尾的行。
结合使用^和$可查询空行。使用- n参数显示实际行数
[[lxj@localhost lxjwork]$ grep -n "^$" file

2:

[lxj@localhost lxjwork]$ cat file

123bjk456

 

345yui678

789hiy123

(返回结果 2:   #说明第二行是空行)
[lxj@localhost lxjwork]$ cat file

123bjk456

abc1233jk

345yui678

auhushabc

789hiy123

[lxj@localhost lxjwork]$ grep -n "^abc" file

2:abc1233jk

(#查询以abc开头的行)
[lxj@localhost lxjwork]$ grep -n "abc$" file

4:auhushabc

(#查询以abc结尾的行)

8. 匹配特殊字符,查询有特殊含义的字符,诸如$ . ‘ " * [] ^ | \ + ? ,必须在特定字符前加\。
[lxj@localhost lxjwork]$ cat file

.jdhk

dhhdj

a.djk

789hiy123

[lxj@localhost lxjwork]$ grep "\." file

.jdhk

a.djk

(#在file中查询包含“.”的所有行)
[lxj@localhost lxjwork]$ cat file

.jdhk

dhhdj

my.conf

dbhjbjj

789hiy123

[lxj@localhost lxjwork]$ grep "my.conf" file

my.conf

(#查询有文件名my. c o n f的行)

9. 目录的查询
[lxj@localhost lxjwork]$ ls -l | grep "^d"

drwxrwxr-x. 2 lxj  lxj  4096 5月  28 03:38 epoll

drwxrwxr-x. 2 lxj  lxj  4096 4月  13 07:21 pipe

drwxrwxr-x. 2 lxj  lxj  4096 6月  21 18:02 pthread

drwxrwxr-x. 2 lxj  lxj  4096 6月  21 19:33 rwlock

drwxrwxr-x. 2 lxj  lxj  4096 5月  26 05:21 select

drwxrwxr-x. 2 lxj  lxj  4096 6月  20 07:44 sem

drwxrwxr-x. 2 lxj  lxj  4096 6月  20 18:06 shm

drwxrwxr-x. 2 lxj  lxj  4096 5月  21 03:06 tcp

drwxrwxr-x. 2 lxj  lxj  4096 5月  20 18:08 udp

(#如果要查询目录列表中的目录)
[lxj@localhost lxjwork]$ ls -l | grep "^d[d]"

(#在一个目录中查询不包含目录的所有文件)

10.排除自身

ps -ef|grep telnet | grep -v grep (在显示的进程中抽出“telnet”进程;并丢弃ps中的grep进程) 

egrep的几个特殊字符

+ :至少一个或是多个   egrep -n ‘go+d‘ pp

?:0个或是一个        egrep -n ‘go?d‘ pp

| :用或的方式来查找   egrep -n ‘go|good‘ pp 查找go或是good

():找出群组的数据      egrep -n ‘g(o|pp)d‘ pp 查看god 或是gppd  这个类似于 [] 但是比[]强大的是可以是多个字符进行乱换

egrep -n ‘d(r|o)e‘ pp  ===== grep -n ‘d[ro]e‘ pp


二、总结:

1. grep最简单的使用方法,匹配一个词:grep word filename

2. 可以从多个文件中匹配:grep word filename1 filenam2 filename3

3. 可以使用正则表达式匹配:grep -E pattern f1 f2 f3...

4. 可以使用-o只打印匹配的字符,如下所示:

[lxj@localhost lxjwork]$ echo this is a line. | grep -E -o "[a-z]*\."

line.

5. 打印除匹配行之外的其他行,使用-v

[lxj@localhost lxjwork]$ echo -e "1\n2\n3\n4" | grep -v -E "[1-2]"

3

4

6. 统计匹配字符串的行数,使用-c

[lxj@localhost lxjwork]$ echo -e "1\n3\n\4\n\2" | grep -o -E "[1-2]" -c

2

7. 如果我们统计字符串模式匹配的次数,可以结合-o和-c,如下:

[lxj@localhost lxjwork]$ echo -e "1\n3\n\4\n\2" | grep -o -E "[1-2]" |wc

      2       2       4

 

8. 如果需要显示行号,可以打开-n,如下:

[lxj@localhost lxjwork]$ echo -e "1\n3\n\4\n\2" | grep -n -E "3"

2:3

9. -b选项可以打印出匹配的字符串想对于其所在的行起始位置的偏移量(从0开始),通常配合-o使用,如下:

[lxj@localhost lxjwork]$ echo "0123456789" | grep -b -o 5

5:5

10. 当字符串在多个文件中匹配时,-l选项将只打印文件名

11. -L与-l相对,只打印不匹配的文件名

[lxj@localhost lxjwork]$ cat file1

linux

is

fun

[lxj@localhost lxjwork]$ cat file2

a

very

popular

os,

linux

[lxj@localhost lxjwork]$ cat file3

what

the

fxxk

[lxj@localhost lxjwork]$ grep -l linux file1 file2 file3

file1

file2

[lxj@localhost lxjwork]$ grep -L linux file1 file2 file3

file3

12. 打开递归搜索功能

lichao@ubuntu:command$ grep -n -R linux .

[lxj@localhost lxjwork]$ grep -n -R linux .

匹配到二进制文件 ./sem/test

匹配到二进制文件 ./shm/client

匹配到二进制文件 ./shm/server

匹配到二进制文件 ./select/client_select

匹配到二进制文件 ./select/server_select

./file1:1:linux

匹配到二进制文件 ./pipe/p.c

匹配到二进制文件 ./pipe/p

匹配到二进制文件 ./pipe/p2

匹配到二进制文件 ./pipe/p4

匹配到二进制文件 ./pipe/p3

匹配到二进制文件 ./pipe/p1

匹配到二进制文件 ./pipe/p4.c

匹配到二进制文件 ./tcp/tcp_client

匹配到二进制文件 ./tcp/tcp_server

匹配到二进制文件 ./epoll/epoll_sever

匹配到二进制文件 ./rwlock/rwlock

匹配到二进制文件 ./pthread/exit

匹配到二进制文件 ./pthread/my_pthread

匹配到二进制文件 ./pthread/mutext_lock

匹配到二进制文件 ./pthread/pro_con

匹配到二进制文件 ./pthread/detach

./file2:5:linux

13. 忽略大小写:-i

[lxj@localhost lxjwork]$ echo "HELLO WORLD" | grep -i "hello"

HELLO WORLD

14. 匹配多个字符串模式

[lxj@localhost lxjwork]$ echo "this is a line" | grep -e "this" -e "is" -e "line" -o

this

is

line

15. 用单独的文件提供匹配样式,每个匹配的样式作为一行,如下例所示:

[lxj@localhost lxjwork]$ cat file1

1$

2

3

[lxj@localhost lxjwork]$ cat file2

1

2

3

4

5

6

7

8

9

10

[lxj@localhost lxjwork]$ grep -f file1 file2

1

2

3

16. 打印匹配行上下文信息,使用 -A n打印匹配行及其后n行信息;使用-B n打印匹配行及其前n行信息;使用 -C n,打印匹配行及其前后n行信息;如果有多重匹配,将使用--隔离。示例如下:

[lxj@localhost lxjwork]$ seq 1 10 | grep 5 -A 3

5

6

7

8

[lxj@localhost lxjwork]$ seq 1 10 | grep 5 -B 3

2

3

4

5

[lxj@localhost lxjwork]$ seq 1 10 | grep 5 -C 3

2

3

4

5

6

7

8

[lxj@localhost lxjwork]$ echo -e "a\nb\nc\nd\na\nb\nc\nd\n" | grep a -A 2

a

b

c

--

a

b

c

17. 使用-q进入静默模式,该模式下,grep命令运行目的仅仅是执行一个条件测试,通常在脚本中使用。通过检查其返回值进行下一步操作。示例如下:

[lxj@localhost lxjwork]$ cat file

hello

world

[lxj@localhost lxjwork]$ cat tmp.sh

#!/bin/bash

if [ $# -ne 2 ]; then

echo "Usage: $0 match_pattern file_name"

exit

fi

match=$1

file=$2

grep -q $match $file

if [ $? -ne 0 ]; then

echo "$match not exist in $file"

else

echo "$match exist in $file"

fi

[lxj@localhost lxjwork]$ ./tmp.sh hello file

hello exist in file

上即为grep常用的选项。

 


本文出自 “无心” 博客,请务必保留此出处http://760470897.blog.51cto.com/10696844/1792742

grep常用指令

标签:shell   正则表达式   grep指令   

原文地址:http://760470897.blog.51cto.com/10696844/1792742

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!