码迷,mamicode.com
首页 > 其他好文 > 详细

强大的文本处理工具之三awk

时间:2018-04-01 19:58:38      阅读:116      评论:0      收藏:0      [点我收藏+]

标签:awk

文本处理三剑客之三,功能十分强大
基本用法

awk [opinions] ‘program‘ var=value file
awk [opinions]  -f  programfile var=value file

通常awk程序由:BEGIN语句块、可使用模式匹配的通用语句块、END语句块组成

基本格式

awk [options] ‘program‘ file 

Pattern和action

  • pattern部分决定动作语句何时触发以及触发事件
    BEGIN ,END
  • action statements对数据进行处理,放在 { } 内指明
    print ,printf
    分隔符、域和记录

    awk在执行时,由分隔符分隔的字段标记$1,$2,$3,$n称为域表示,$0为所有域,即默认打印所有信息
    文件的每一行称为记录
    省略 action,即默认执行print $0 的操作

    工作原理


    1. 执行BEGIN { action } 语句块中的语句
    2. 从文件/标准输入读取第一行,然后执行pattern{ action ;…} 语句块,逐行执行知道文件读取完毕
    3. 当读至输入流末尾时,执行END{action;…}语句块
      基本选项:-F 指明输入时用到的字段分隔符 // -v var=value 自定义变量

      [root@linux-centos7~]# awk -F: ‘{print}‘ /etc/passwd
      上述语句执行结果为/etc/passwd文件中的所有内容,因为print没有指定任何字段,默认打印所有内容

      [root@linux-centos7~]# awk -F: ‘{print $1,$7}‘ /etc/passwd
      上述语句执行结果为/etc/passwd文件中,以" : "为分隔符第一列和第七列的内容,默认中间用一个空格分隔
      技术分享图片

      [root@linux-centos7~]# awk -v test=‘hello‘ BEGIN‘{print test}‘ /etc/passwd
      上述语句执行结果只有一个hello,因为在awk里面-v 赋值test为hello,print打印test变量的值,由于前面有BEGIN,故只输出BEGIN语句块执行结果,不会输出和/etc/passwd文件行数一样多的hello,因为在BEGIN之后没有pattern语句

    [root@linux-centos7~]# awk -v test=‘hello‘ BEGIN‘{print test}‘‘{print $1,$7}‘ /etc/passwd
    上述语句则会输出

强大的文本处理工具之三awk

标签:awk

原文地址:http://blog.51cto.com/11742700/2093585

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!