近来在学习linux跟shell脚本。英文又多年不用还给教师了。遇到不懂的单词都要开个词霸网页词典来翻译,久了多有不爽。偶然找到http://www.iteye.com/topic/819440中提到一个翻译英文单词的shell脚本,可惜是多年以前的,并且用的还是如今被墙的谷歌,当然失效了。
translate() { wget -qO- "http://ajax.googleapis.com/ajax/services/language/translate?v=1.0&q=$1&langpair=${2:-en}|${3:-zh}" | sed -E -n ‘s/[[:alnum:]": {}]+"translatedText":"([^"]+)".*/\1/p‘; return 0; }
为了方便自己学习和练手,修改成金山词典的。苦于半桶水的水平,反复用了好些管道和sed进行过滤和排版,最后勉强可用。写出来交流交流,让各路高手给小弟指正一下:
translate() { echo echo "${1}:" wget -qO- "http://www.iciba.com/$1"| sed -n ‘/"prons"/,/"net_paraphrase"/p‘| sed -e ‘s/<[^>]*>//g‘ -e ‘s/[[:space:]]//g‘| tr -d ‘\n‘| sed -e ‘s/]/]\t/‘ -e ‘s/[a-z]*\./\n&/g‘ echo echo return 0; }
把这段函数放到~/.bashrc里面,重开一个终端就可以用了:
$ translate computer computer: 英[kmpju:t(r)] 美[kmpjut] n.(电子)计算机,电脑 $
这个地方自己一直不是很满意,感觉总有更简洁的方法来实现:
sed -n ‘/"prons"/,/"net_paraphrase"/p‘ //定位需要的代码块,我选择从读音到简单词义部分 sed -e ‘s/<[^>]*>//g‘ -e ‘s/[[:space:]]//g‘ //删除所有<...>的HTML标记和空格 tr -d ‘\n‘ //删除所有换行,把文字都排成一行 sed -e ‘s/]/]\t/‘ -e ‘s/[a-z]*\./\n&/g‘ //音标之间加TAB,词性前加换行
本文出自 “willron学习笔记” 博客,请务必保留此出处http://willron.blog.51cto.com/4871077/1574834
原文地址:http://willron.blog.51cto.com/4871077/1574834