1.sed(流编辑器)背景知识
(1)sed命令行的基本格式为:
sed option ‘script‘ file1 file2 ... sed option -f scriptfile file1 file2 .
(2)sed处理的文件:既可以由标准输入重定向得到,也可以当命令行参数传入,命令行参数可以一次传入多个文件,sed会依次处理。
(3)sed的编辑命令:可以直接当命令行参数传入,也可以写成一个脚本文件然后用-f参数指定。
(4)编辑命令的格式为:/pattern/action
pattern是正则表达式,action是编辑操作。
sed程序一行一行读出待处理文件,
如果某一行与pattern匹配,则执行相应的action;
如果一条命令没有pattern而只有action,这个action将作用于待处理文件的每一行。
(5)sed工作原理
sed 是一种在线编辑器,它一次处理一行内容。
处理时,把当前处理的行存储在临时缓冲区中,称为“模式空间”(pattern space),接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。接着处理下一行,这样不断重复,直到文件末尾。
文件内容并没有改变,除非你使用重定向存储输出。
Sed主要用来自动编辑一个或多个文件;简化对文件的反复操作;
2.使用
(1)/pattern/p :打印匹配pattern的行
注意:把原文件内容和匹配pattern的行都打印出来(即再源文件的基础上再打印匹配的行)
只想输出处理结果,加上-n选项
(2)/pattern/d :删除匹配pattern的行
注意:sed命令不会修改原文件,删除命令只表示某些行不打印输出,而不是从原文件中删去。
想修改原文件可使用sed -i。
(3)/pattern/s/pattern1/pattern2/:查找符合pattern的行,将该行第一个匹配pattern1的字符串替换为pattern2
若想把文本所有的满足条件的都替换加上g,即/pattern/s/pattern1/pattern2/g
pattern2中若出现&:表示原文件的当前行中与pattern1相匹配的字符串
pattern2中的\1表示与pattern1的第一个()括号相匹配的内容;\2表示与pattern1的第二个()括号相匹配的内容。
sed默认使用Basic正则表达式规范,如果指定了-r选项则使用Extended规范,那么()括号就不必转义了。
(4)定址
sed -n ‘3p’ file #打印第三行 sed -n ‘100,300p’ file #打印100~300行的信息(包括100和300)
(5)命令
a\ :在当前行后添加一行或多行。多行时除最后一行外,每行末尾需用“\”续行 c\ :用此符号后的新文本替换当前行中的文本。多行时除最后一行外,每行末尾需用”\"续行 i\ :在当前行之前插入文本。多行时除最后一行外,每行末尾需用”\"续行d删除行 h : 把模式空间里的内容复制到暂存缓冲区 H :把模式空间里的内容追加到暂存缓冲区 g :把暂存缓冲区里的内容复制到模式空间,覆盖原有的内容 G:把暂存缓冲区的内容追加到模式空间里,追加在原有内容的后面 l :列出非打印字符 p :打印行 n :读入下一输入行,并从下一条命令而不是第一条命令开始对其的处理 q :结束或退出sed r :从文件中读取输入行 ! :对所选行以外的所有行应用命令 s :用一个字符串替换另一个 g :在行内进行全局替换 w :将所选的行写入文件 x :交换暂存缓冲区与模式空间的内容 y :将字符替换为另一字符(不能对正则表达式使用y命令) -e :进行多项编辑,即对输入行应用多条sed命令时使用 -n :取消默认的输出 -f :指定sed脚本的文件名
(6)退出状态
不管是否找到指定的模式,它的退出状态都是0。只有当命令存在语法错误时,sed的退出状态才不是0。
3.运用
(1)给每行结尾添加一行空行
(2)用sed模拟出tac的功能(倒序输出)
1!G:第1行不执行“G”命令,从第2行开始执行。(可以通过右图的对比-少1!,最后输出多一行空行)
$!d:最后一行不删除(保留最后1行)
把数据追加到模式空间(第一行除外),然后把它赋值到保持空间,再把它从模式空间删除(最后一行除外)。
(3)追加匹配行到文件结尾
(4)行列转化
(5)求1~100的求和
方法一:
方法二:
(6)打印奇偶数行
本文出自 “sunshine225” 博客,请务必保留此出处http://10707460.blog.51cto.com/10697460/1793405
原文地址:http://10707460.blog.51cto.com/10697460/1793405