标签:处理 执行 命令详解 程序 文件输入 自动 打印 指令 直接
Linux sed命令是利用script来处理文本文件。sed可依照script的指令,来处理、编辑文本文件。
Sed主要用来自动编辑一个或多个文件;简化对文件的反复操作;编写转换程序等。
执行时,sed会从文件或者标准输入中读取一行,将其复制到缓冲区,对文本编辑完成之后,读取下一行直到所有的文本行都编辑完毕。
所以sed命令处理时只会改变缓冲区中文本的副本,如果想要直接编辑原文件,可以使用-i选项或者将结果重定向到新的文件中。
sed命令的基本语法如下:
# sed [options] commands [inputfile...]
options表示sed命令的一些选项,常见的选项如下表:
-n 取消默认输出
-e 多点编辑,可以执行多个子命令
-f 从脚本文件中读取命令(sed操作可以事先写入脚本,然后通过-f读取并执行)
-i 直接编辑原文件
-l 指定行的长度
-r 在脚本中使用扩展表达式
应用场景
sed命令比较适用于大的文本文件,用普通文本编辑器难以胜任的情况。下面分别介绍直接打印、插入、删除、替换等编辑操作。
实验用文件内容
#===================test1.txt======================
letitia
mail
uuencode
1003605091
01566
(1)行打印,输出缓冲区内容,使用sed的p子命令
sed ‘1,3 p‘ test1.txt
echo "====================="
sed -n ‘1,3 p‘ test1.txt
#输出结果
letitia
letitia
mail
mail
uuencode
uuencode
1003605091
01566
=====================
letitia
mail
uuencode
p子命令代表print,可以打印出sed缓冲区内的内容。
sed命令中,直接采用数字代表某个特定的文本行:‘1 p‘代表打印第一行;‘1,3 p‘代表打印1到3行;特别的,最后一行的行号为$。
观察输出结果,不使用-n选项时,sed命令把1到3行输出了两次。这是因为不使用-n时,sed首先读取一行,并默认将缓冲区内的文本输出出来,之后p子命令再次输出。使用-n时,默认输出取消,只有p子命令的输出结果。
sed -n ‘/^ma/,5 p‘ test1.txt
#输出结果
mail
uuencode
1003605091
01566
sed命令支持正则表达式定位。语法为/re/,re表示正则表达式。
本例表示打印出从匹配正则表达式的地方到第5行,也就是从匹配以ma开头的文本行处开始。
sed -n ‘1~2 p‘ test1.txt
#输出结果
letitia
uuencode
01566
1~2表示从第一行开始,行号递增2输出,即输出奇数行。语法格式为first~step。
(2)插入文本行,追加文本行
这两种情况很类似。插入文本使用i子命令,表示在指定位置前面插入文本;追加文本使用a子命令,表示在指定位置之后插入文本。观察一下两个的区别:
sed -n -e ‘2 i insert‘ -e ‘1,4 p‘ test1.txt
#-e选项表示多个子命令,本例执行i子命令之后执行了p子命令
#输出结果
letitia
insert
mail
uuencode
1003605091
sed -n -e ‘2 a insert‘ -e ‘1,4 p‘ test1.txt
#输出结果
letitia
mail
insert
uuencode
1003605091
(3)删除文本行,使用d子命令
sed -n -e ‘2 d‘ -e ‘1,$ p‘ test1.txt
#输出结果
letitia
uuencode
1003605091
01566
(4)替换文本行,使用c子命令
sed -n -e ‘2 c newmail‘ -e ‘1,$ p‘ test1.txt
#输出结果
letitia
newmail
uuencode
1003605091
01566
【注】以上均未使用-i选项,所以更改的只是副本。
(5)替换指定文本,使用s子命令
这一个命令实用性很广,并且灵活。语法也比之上面特别一些:
sed ‘位置参数 s/pattern/replaced/[flag]‘
pattern为要替换的文本,支持正则表达式,replaced表示用来替换的一般字符串(不支持正则表达式)。
flag是替换标志,用来影响匹配替换的规则:
3. 其他注意事项
以上都是采用了文件输入做实验,也可以采用其他方式,例如
sed -i "s/letitia/hello world/g" `grep "letitia" -rl test1.txt`
将grep的结果作为输入,注意要用反引号括起来,将括号内部分解释为linux命令。
当用户的编辑操作比较复杂时,建议使用sed脚本文件。
同正则表达式一样,匹配元字符时要用转义。使用基本正则表达式时,{}等也要转义。
------------------END-------------------------
标签:处理 执行 命令详解 程序 文件输入 自动 打印 指令 直接
原文地址:http://blog.51cto.com/14059979/2313380