标签:linux grep
linux grep用法
grep命令
功能:输入文件的每一行中查找字符串。
基本用法:
grep [-acinv] [--color=auto] [-A n] [-B n] ‘搜寻字符串‘ 文件名
参数说明:
-a:将二进制文档以文本方式处理
-c:显示匹配次数
-i:忽略大小写差异
-n:在行首显示行号
-A:After的意思,显示匹配字符串后n行的数据
-B:before的意思,显示匹配字符串前n行的数据
-v:显示没有匹配行-A:After的意思,显示匹配部分之后n行-B:before的意思,显示匹配部分之前n行
--color:以特定颜色高亮显示匹配关键字
–color选项是个非常好的选项,可以让你清楚的明白匹配了那些字符。最好在自己的.bashrc或者.bash_profile文件中加入:
alias grep=grep --color=auto
每次grep搜索之后,自动高亮匹配效果了。
‘搜寻字符串’是正则表达式,注意为了避免shell的元字符对正则表达式的影响,请用单引号(’’)括起来,千万不要用双引号括起来("”)或者不括起来。
正则表达式分为基本正则表达式和扩展正则表达式。下面分别简单总结一下。
基本正则表达式
正则表达式学习,主要是对正则表达式元数据的学习。正则表达式本身没有什么高深的东西,本文仅仅对基本正则表达式的元数据进行一下总结:
元数据
意义和范例
(1) ^root搜寻以root开头的行。
例如:搜寻以root开头的脚本
[root@s80sit shell]# grep -n ‘^root‘ /etc/passwd 1:root:x:0:0:root:/root:/bin/bash
(2)word$ 搜寻以word结束的行
例如,搜寻以‘nologin’结束的行
[root@s80sit shell]# grep -n ‘nologin$‘ /etc/passwd 2:bin:x:1:1:bin:/bin:/sbin/nologin 3:daemon:x:2:2:daemon:/sbin:/sbin/nologin 4:adm:x:3:4:adm:/var/adm:/sbin/nologin 5:lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin 9:mail:x:8:12:mail:/var/spool/mail:/sbin/nologin 10:uucp:x:10:14:uucp:/var/spool/uucp:/sbin/nologin 11:operator:x:11:0:operator:/root:/sbin/nologin 12:games:x:12:100:games:/usr/games:/sbin/nologin 13:gopher:x:13:30:gopher:/var/gopher:/sbin/nologin 14:ftp:x:14:50:FTP User:/var/ftp:/sbin/nologin 15:nobody:x:99:99:Nobody:/:/sbin/nologin 16:dbus:x:81:81:System message bus:/:/sbin/nologin 17:usbmuxd:x:113:113:usbmuxd user:/:/sbin/nologin 18:rpc:x:32:32:Rpcbind Daemon:/var/cache/rpcbind:/sbin/nologin 19:oprofile:x:16:16:Special user account to be used by OProfile:/home/oprofile:/sbin/nologin 20:vcsa:x:69:69:virtual console memory owner:/dev:/sbin/nologin 21:rtkit:x:499:497:RealtimeKit:/proc:/sbin/nologin 22:abrt:x:173:173::/etc/abrt:/sbin/nologin 23:hsqldb:x:96:96::/var/lib/hsqldb:/sbin/nologin 24:avahi-autoipd:x:170:170:Avahi IPv4LL Stack:/var/lib/avahi-autoipd:/sbin/nologin 25:apache:x:48:48:Apache:/var/www:/sbin/nologin 26:saslauth:x:498:76:"Saslauthd user":/var/empty/saslauth:/sbin/nologin 27:postfix:x:89:89::/var/spool/postfix:/sbin/nologin 28:rpcuser:x:29:29:RPC Service User:/var/lib/nfs:/sbin/nologin 29:nfsnobody:x:65534:65534:Anonymous NFS User:/var/lib/nfs:/sbin/nologin 30:haldaemon:x:68:68:HAL daemon:/:/sbin/nologin 31:gdm:x:42:42::/var/lib/gdm:/sbin/nologin 32:ntp:x:38:38::/etc/ntp:/sbin/nologin 33:pulse:x:497:495:PulseAudio System Daemon:/var/run/pulse:/sbin/nologin 34:webalizer:x:67:67:Webalizer:/var/www/usage:/sbin/nologin 35:sshd:x:74:74:Privilege-separated SSH:/var/empty/sshd:/sbin/nologin 36:tcpdump:x:72:72::/:/sbin/nologin 40:cloudera-scm:x:496:492:Cloudera Manager:/var/lib/cloudera-scm-server:/sbin/nologin 43:solr:x:493:488:Solr:/var/lib/solr:/sbin/nologin 52:sqoop2:x:484:479:Sqoop 2 User:/var/lib/sqoop2:/sbin/nologin 55:sentry:x:481:476:Sentry:/var/lib/sentry:/sbin/nologin 57:spark:x:479:474:Spark:/var/lib/spark:/sbin/nologin 61:zabbix:x:477:472:Zabbix Monitoring System:/var/lib/zabbix:/sbin/nologin
(3). 匹配任意一个字符。
例如:grep –n ‘e.e’ regular.txt
匹配e和e之间有任意一个字符,可以匹配eee,eae,eve,但是不匹配ee。
(4)\ 转义字符
例如:搜寻’,’是一个特殊字符,在正则表达式中有特殊含义。必须要先转义。
grep –n ‘\” regular.txt
(5)* 前面的字符重复0到多次。
例如匹配gle,gogle,google,gooogle等等
grep –n ‘go*gle’ regular.txt (o*表示o可以出现0次或者多次)
[root@s80sit shell]# cat aaaaa.txt gle, gogle, google, gooogle [root@s80sit shell]# grep -n ‘go*gle‘ aaaaa.txt 2:gogle, 3:google, 4:gooogle [root@s80sit shell]#
(6)[list] 匹配一系列字符中的一个。
[root@s80sit shell]# cat aaaaa.txt gle, gogle, google, gooogle [root@s80sit shell]# grep -n ‘[o]‘ aaaaa.txt 2:gogle, 3:google, 4:gooogle
(7)[n1-n2] 匹配一个字符范围中的一个字符。
例如:匹配数字字符[0-9]
[root@s80sit shell]# cat aaaaa.txt gle, gogle, google, gooogle 1223 1223hh [root@s80sit shell]# grep -n ‘[0-9]‘ aaaaa.txt 5:1223 6:1223hh
(8)[^list] 匹配字符集以外的字符
[root@s80sit shell]# cat aaaaa.txt gle, gogle, google, gooogle 1223 1223hh [root@s80sit shell]# grep -n ‘[^e]‘ aaaaa.txt 1:gle, 2:gogle, 3:google, 4:gooogle 5:1223 6:1223hh
(9)匹配非o字符
\{n1,n2\} 前面的字符重复n1,n2次
例如:匹配google,gooogle。
[root@s80sit shell]# cat aaaaa.txt gle, gogle, google, gooogle 1223 1223hh googleasss googleasss [root@s80sit shell]# grep -n ‘go\{2,3\}gle‘ aaaaa.txt 3:google, 4:gooogle 7:googleasss 8:googleasss [root@s80sit shell]#
(10)\<word 单词是的开头。
例如:匹配以g开头的单词
[root@s80sit shell]# grep -n ‘\<g‘ aaaaa.txt 1:gle, 2:gogle, 3:google, 4:gooogle 7:googleasss 8:googleasss
(11)word\> 匹配单词结尾
例如:匹配以s结尾的单词
[root@s80sit shell]# grep -n ‘s\>‘ aaaaa.txt 7:googleasss 8:googleasss
扩展正则表达式
grep一般情况下支持基本正则表达式,可以通过参数-E支持扩展正则表达式,
另外grep单独提供了一个扩展命令叫做egrep用来支持扩展正则表达式,这条命令和grep -E等价。
虽然一般情况下,基本正则表达式就够用了。特殊情况下,复杂的扩展表达式,可以简化字符串的匹配。
扩展正则表达式就是在基本正则表达式的基础上,增加了一些元数据。
元数据
意义和范例
(12)+ 重复前面字符1到多次
例如:匹配god,good,goood等等字符串。
[root@s80sit shell]# cat aaaaa.txt gle, gogle, google, gooogle 1223 1223hh googleasss googleasss goo good goood [root@s80sit shell]# grep -nE ‘go+d‘ aaaaa.txt 10:good 11:goood
(13)? 匹配0或1次前面的字符
[root@s80sit shell]# cat aaaaa.txt gle, gogle, google, gooogle 1223 1223hh googleasss googleasss goo good goood god [root@s80sit shell]# grep -nE ‘go?d‘ aaaaa.txt 12:god
(14)| 或(or)的方式匹配多个字串
例如:grep –nE ‘god|good’ regular.txt
匹配god或者good
[root@s80sit shell]# cat aaaaa.txt gle, gogle, google, gooogle 1223 1223hh googleasss googleasss goo good goood god [root@s80sit shell]# grep -nE ‘god|good‘ aaaaa.txt 10:good 12:god
(15) () 匹配整个括号内的字符串,原来都是匹配单个字符
例如:搜寻good或者glad
[root@s80sit shell]# cat aaaaa.txt gle, gogle, google, gooogle 1223 1223hh googleasss googleasss goo good goood god hh lad gladdddd [root@s80sit shell]# grep -nE ‘g(la|oo)‘ aaaaa.txt 3:google, 4:gooogle 7:googleasss 8:googleasss 9:goo 10:good 11:goood 15:gladdddd
Linux下面正则表达式博大精深,上文支持总结了最常用的部分,如果熟练掌握的上面部分的正则表达式基本上可以满足日常使用了。
另外Linux很多命令支持正则表达式,比如find,sed,awk等等。请在使用的时候参照这些命令的手册使用正则表达式。
本文出自 “梁小明的博客” 博客,请务必保留此出处http://7038006.blog.51cto.com/7028006/1826116
标签:linux grep
原文地址:http://7038006.blog.51cto.com/7028006/1826116