gawk命令详解

时间：2018-08-05 23:31:48 阅读：389 评论：0 收藏：0 [点我收藏+]

标签：expr argv nal option name 关系模式空间 star %s

GNU awk：

技术分享图片

文本处理三工具：grep, sed, awk

grep, egrep, fgrep：文本过滤工具；pattern

sed: 行编辑器

模式空间、保持空间

awk：报告生成器，格式化文本输出；

AWK: Aho, Weinberger, Kernighan --> New AWK, NAWK

GNU awk, 简称gawk

技术分享图片

gawk - pattern scanning and processing language

基本用法：gawk [options] ‘program‘ FILE ...

program: PATTERN{ACTION STATEMENTS}

语句之间用分号分隔

print, printf 是ACTION STATEMENTS的两个选项

选项：

-F：指明输入时用到的字段分隔符；

-v var=value: 自定义变量；

技术分享图片

1、print

print item1, item2, ...

要点：

(1) 逗号分隔符；

(2) 输出的各item可以字符串，也可以是数值；当前记录的字段、变量或awk的表达式；

(3) 如省略item，相当于print $0;

技术分享图片

2、变量

2.1 内建变量

FS：input field seperator，输入时的字段分隔符，默认为空白字符；

OFS：output field seperator，输出时的字段分隔符默认为空白字符；

技术分享图片

RS：input record seperator，输入时的换行符；

ORS：output record seperator，输出时的换行符；

技术分享图片

NF：number of field，每一行的字段数量

{print NF}, {print $NF}

如果引用awk内部的变量(比如NF)的话，是不能加$的，像$1,$2这是字段

技术分享图片

NR：number of record, 行数；

技术分享图片

FNR：各文件分别计数；行数；

技术分享图片

FILENAME：当前文件名；

ARGC：命令行参数的个数；

ARGV：数组，保存的是命令行所给定的各参数；

技术分享图片

2.2 自定义变量

1、 -v var=value 自定义变量

变量名区分字符大小写；

技术分享图片

2、在program中直接定义

3、printf命令

格式化输出：printf FORMAT, item1, item2, ...

(1) FORMAT必须给出;

(2) 不会自动换行，需要显式给出换行控制符，\n

(3) FORMAT中需要分别为后面的每个item指定一个格式化符号；

格式符：

%c: 显示字符的ASCII码；

%d, %i: 显示十进制整数；

%e, %E: 科学计数法数值显示；

%f：显示为浮点数；

%g, %G：以科学计数法或浮点形式显示数值；

%s：显示字符串；

%u：无符号整数；

%%: 显示%自身；

技术分享图片以字符串形式显示文件的第一个字段

技术分享图片

修饰符：

#[.#]：第一个数字控制显示的宽度；第二个#表示小数点后的精度；

%3.1f

-：左对齐

+：显示数值的符号

技术分享图片

4、操作符

算术操作符：

x+y, x-y, x*y, x/y, x^y, x%y

-x：负x

+x：把字符串转换为数值；

字符串操作符：

没有符号的操作符，表示字符串连接

赋值操作符：

=, +=, -=, *=, /=, %=, ^=

++, --

比较操作符：

>, >=, <, <=, !=, ==

模式匹配符：

~：是否匹配

!~：是否不匹配

逻辑操作符：

函数调用：

function_name(argu1, argu2, ...)

条件表达式：

selector?if-true-expression:if-false-expression

selector：条件表达式

?：判断为真还是为假，为真则执行if-true-expression，为假则执行if-false-expression

# awk -F: ‘{$3>=1000?usertype="Common User":usertype="Sysadmin or SysUser";printf "%15s:%-s\n",$1,usertype}‘ /etc/passwd

技术分享图片

5、PATTERN

(1) empty：空模式，匹配每一行；

(2) /regular expression/：仅处理能够被此处的模式匹配到的行；

(3) relational expression: 关系表达式；结果有“真”有“假”；结果为“真”才会被处理；真：结果为非0值，非空字符串；

# awk -F: ‘$3>=500{print $1,$3}‘ /etc/passwd 大于500才会处理

# awk -F: ‘$NF=="/bin/bash"{print $1,$NF}‘ /etc/passwd

#awk -F: ‘$NF~/bash$/{print $1,$NF}‘ /etc/passwd

(4) line ranges：行范围，指定起始结束行

startline,endline：/pat1/,/pat2/

#awk -F: ‘/^nobody/,/^sshd/{print $1}‘ /etc/passwd

注意：不支持直接给出数字的格式

# awk -F: ‘(NR>=2&&NR<=10){print $1}‘ /etc/passwd

(5) BEGIN/END模式

BEGIN{}: 仅在开始处理文件中的文本之前执行一次；

# awk -F: ‘BEGIN{print " username uid\n-----"}{printf "%15s,%8s\n",$1,$3}‘ /etc/passwd

END{}：仅在文本处理完成之后执行一次；

#awk -F: ‘BEGIN{print " username uid\n-----"}{printf "%15s,%8s\n",$1,$3}END{print "===========\n END"}‘ /etc/passwd

6、常用的action

(1) Expressions

(2) Control statements：if, while等；

(3) Compound statements：组合语句；

(4) input statements

(5) output statements

7、控制语句

if(condition) {statments} 但分支语句

if(condition) {statments} else {statements}组合语句

while(conditon) {statments}

do {statements} while(condition)do循环

for(expr1;expr2;expr3) {statements}

break控制语句

continue

delete array[index]

delete array

exit

{ statements }组合语句

gawk命令详解

标签：expr argv nal option name 关系模式空间 star %s

原文地址：https://www.cnblogs.com/hanshanxiaoheshang/p/9427681.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行