标签:linux awk
awk与sed本身都是一个完整的编程语言,可以用来方便的处理文本。
awk正常的结构: cat tmp.txt | awk ‘BEGIN{}{}END{}‘ --带有表头,带有中间的处理过程,带有结尾--
常用用法:cat tmp.txt|awk ‘{print $1}‘ --tmp.txt中字段已空格分隔,$0显示整行,$1表示第一个域,$NF最后一个,$NF-1倒数第二个域,默认的分隔符是空格--
1、域分隔符是:
cat /etc/passwd|awk -F‘:‘ ‘{print $1,$NF}‘ --命令行模式下,-F参数可修改输入的分隔符,即处理文件时的分隔符,该命令为以:分隔passwd文件,打印第一个域和最后一个域,输出字符默认已空格分隔--
cat /etc/passwd|awk -F‘:‘ ‘{print $1$NF}‘ --输出第一个域和最后一个域,之间无空格,--
cat /etc/passwd|awk -F‘:‘ ‘{print $1“____”$NF}‘--输出第一个域和最后一个域,之间分隔为____,--
2、匹配行打印域
例文件tmp.txt:
11 aa 666
22 bb 777
33 cc 888
命令:
cat tmp.txt|awk ‘/bb/{print $0}‘ 结果:22 bb 777 --内容匹配到bb的行打印--
cat tmp.txt|awk ‘/bb/{print $3}‘ 结果:777 --内容匹配到bb的行,打印第三个域,默认分隔符为空格--
cat tmp.txt|awk ‘$2~/b/‘ {print $3}结果:777 --第二个域可以匹配b的行,打印第三个域,注意有空格--
可以减少一次grep对文件的查找
3、判断打印
cat /etc/passwd|awk -F‘:‘ ‘{if($1=="bill")print}‘ --第一个域等于字符串bill,打印--
4、数组
例文件
search 111
search 222
cm 333
search 444
命令:
cat tmp.txt |awk ‘{a[$1]++}END{for(i in a)print i,a[i]}‘
结果:
cm 1
search 3
a[$1]为一个数据,a[$1]++记录不同数据出现次数
标签:linux awk
原文地址:http://ql0722.blog.51cto.com/4353164/1614752