由于工作需要,需要截取一个html文件中的一些段,导入到数据库中(当然用诸如UE、Notepad++之类的文本编辑软件可以很简单的实现)。但是,思考了一下能否使用命令去实现呢?
以下是一个模板文件:
当然,一个html文件中不可能只有这几个段,我们可以使用‘grep -e 字符串1 -e 字符串2’这样的命令去筛选就好了。
[root@centos1 myScript]# cat test.log <sffid>1234</sffid> <policyno>PDAA1234</policyno> <sffid>5678</sffid> <policyno>PDAA5678</policyno> <sffid>7890</sffid> <policyno>PDAA7890</policyno>
可以通过以下命令来处理:
[root@centos1 myScript]# cat test.log |sed ‘s/<sffid>//g‘ |sed ‘s/<policyno>//g‘ |sed ‘s/<\/sffid>//g‘ |sed ‘s/<\/policyno>//g‘ |sed ‘N;s/\n/|/g‘ 1234|PDAA1234 5678|PDAA5678 7890|PDAA7890
如果有更好的方法,望大家指导!
本人只是个小菜鸟,希望每天可以学习一点东西,有点小进步~
原文地址:http://akiny09.blog.51cto.com/1299657/1433736