标签:linux文本处理
文本处理工具grep,egrep和正则表达式的使用
1、 详情
grep:Linux系统中grep(global serch regular expression and printout the line)是一种强大的文本搜索过滤工具,根据用户指定的模式对目标文本进行匹配检查,打印匹配到的行。表示全局正则表达式版本,它的使用权限是所有用户。
egrep: 用于在文件内查找指定的字符串。egrep 执行效果与grep相似,使用的语法及参数可参照grep,最大的区别在与解读字符串的的方法。egrep是用extended regular expression来解读的。也就是说他本来就是扩展的正则表达式,所以更加的规范简单方便。
2、 常用命令
grep:
--color=auto 将匹配的结果着色显示 | -B# 显示关键字行及向前#行 |
-v 反向匹配 | -C# 显示关键字向前#行,当前行,及向后#行 |
-E 使用扩展正则表达式或egrep | -e 关键字1 -e 关键字2 实现多个选项间的逻辑or关系 |
-n 显示的结果前增加行号 | -w 匹配整个单词 |
-c 仅显示匹配到结果的行数 | --i 忽略大小写 |
-o 仅显示匹配到的字符串 | -F 不使用正则表达式或 fgrep |
-q 静默模式,不输出任何信息 或者&> /dev/null | -A# 显示关键字行及向后#行 |
egrep:=grep –E 用法和grep差不多就是更加简单方便。一般次数表示不需要\,除去\<\>和\b\b。
正则表达式
. 匹配任意单个字符 | [] 匹配指定范围内的任意单个字符 |
[^] 匹配指定范围外的任意单个字符 | [:alnum:] 或 [0-9a-zA-Z] |
[:alpha:] 或 [a-zA-Z] | [:upper:] 或 [A-Z] |
[:lower:] 或 [a-z] | [:blank:] 空白字符(空格和制表符) |
[:space:] 水平和垂直的空白字符(比[:blank:]包含的范围广) | [:cntrl:] 不可打印的控制字符(退格、删除、警铃...) |
[:digit:] 十进制数字或[0-9] | [:xdigit:]十六进制数字 |
[:graph:] 可打印的非空白字符 | [:print:] 可打印字符 |
[:punct:] 标点符号 |
3、习题解读:
1、显示/proc/meminfo文件中以大小s开头的行(要求使用两种方法)。
cat/proc/meminfo|grep -e ^s -e ^S
cat/proc/meminfo|grep "^s\|^S"
cat/proc/meminfo|grep "^[s\|S]"
cat/proc/meminfo|grep "^[Ss]"
cat/proc/meminfo|grep -i "^s"
2、显示/etc/passwd文件中不以/bin/bash结尾的行。
3、显示用户rpc默认的shell程序。
4、找出/etc/passwd中的两位或三位数。
5、显示CentOS7的/etc/grub2.cfg文件中,至少以一个空白
字符开头的且后面存非空白字符的行。
6、找出“netstat -tan”命令的结果中以‘LISTEN’后跟任意多个空白字符结尾的行。
7、显示CentOS7上所有系统用户的用户名和UID(两种)。
8、添加用户bash、testbash、basher、sh、nologin(其shell
为/sbin/nologin),找出/etc/passwd用户名同shell名的行。
9、仅利用df和grep和sort,取出磁盘各分区利用率,并从大到小排序。
10、显示三个用户root、mage、wang的UID和默认shell。
11、找出/etc/rc.d/init.d/functions文件中行首为某单词(包括下划线)后面跟一个小括号的行。
12、使用egrep取出/etc/rc.d/init.d/functions中其基名。
13、使用egrep取出上面路径的目录名。
14、统计last命令中以root登录的每个主机IP地址登录次数
15、利用扩展正则表达式分别表示0-9、10-99、100-199、200-249、250-255
16、显示ifconfig命令结果中所有IPv4地址。
17、将此字符串:welcome to magedu linux 中的每个字符去重并排序,重复次数多的排到前面。
标签:linux文本处理
原文地址:http://13004186.blog.51cto.com/12994186/1951993