标签:main oop home 十分 处理 end 正则 脚本语言 sed
UNIX/LINUX下有个工具叫sed,起源于ed命令,但没有人机交互,完全是脚本语言。sed虽然是结构化的程序,但其虚拟出来的机器与我们实际机器相差甚远,依靠模式空间和保留空间的交替使用、正则表达式不断替换达到处理的目的。
sed有相当一部分粉丝,就如同lisp那样,因为与众不同,而用sed写出sed不擅长的事情是粉丝的追求,似乎这种方式很有黑客精神的感觉,其实很屌丝。
这个网址叫the sed $HOME,里面汇聚了很多精英脚本,一个个神一样的sed脚本啊。
http://sed.sourceforge.net/grabbag/scripts/dc.sed
the sed $HOME 里面的上面这个脚本,被我们当成是sed的终极脚本,脚本十分诡异,实现了一个dc计算器(UNIX下的一个基于逆波兰式的任意精度计算器),我曾试图读懂它,但不得不说,sed程序的确不是拿来给人读的。
我也曾经是sed粉丝中的一员,无论什么样的文本处理,我都希望尝试着用sed去写。
翻以前在论坛里的帖子,我曾经出过一道用sed题目:
得出一行中最大的数 比如 00123xdsd0176ddsdw201eew 得出201 19 19为其位置
sed里面没有任何直接的数学运算,此类问题都需要给诡异的技巧。我给了一个解答如下:
#!/usr/bin/sed -rnf /[0-9]/!d s/[^0-9]/ /g s/$/ 0123456789/ tloop :loop s/^( *)([0-9]+)( +)([0-9]+)( .*0123456789)$/\1b\2e\3b\4e\5/ tmain h s/[0-9].*/ / s/./1/g :cnt s/(^|;)1111111111/1;/g tcnt s/111111111/9/g s/11111111/8/g s/1111111/7/g s/111111/6/g s/11111/5/g s/1111/4/g s/111/3/g s/11/2/g :zero s/;;/;0;/g tzero s/(^$)|;$/0/ s/;//g G tend :end s/(.*)\n *([0-9]+).*0123456789$/\2 \1/ tend2 d :end2 p d :main s/b(0+)/\1b/g h :a s/(bf*)[0-9]/\1f/ ta /(bf*)e.*\1f/ { :e g :b s/[0-9]([0-9]*b.*b)/ \1/ tb :B s/(b *)[0-9](.*b)/\1 \2/ tB s/[be]//g tloop } s/(bf*e)(.*)(bf*e)/\3\1/ /(bf*)e.*\1f/ { :f g :c s/(e.* )[0-9]([0-9]*b)/\1 \2/ tc :C s/(b *)[0-9]([^b]+)$/\1 \2/ tC s/[be]//g tloop } g :d /b(.).*b\1/! { /b(.).*b(.).*\1[0-9]*\2[0-9]*$/be bf } s/b([0-9])(.*)b([0-9])/\1b\2\3b/ td be
看了看,几年之前的代码居然也大致看懂了。随着论坛的衰落,现在没有这个心境写sed了,突然有些怀念以前。
标签:main oop home 十分 处理 end 正则 脚本语言 sed
原文地址:http://www.cnblogs.com/Colin-Cai/p/7222794.html