码迷,mamicode.com
首页 > 其他好文 > 详细

wvs爬虫 目录和文件提取 导出

时间:2015-11-16 19:06:48      阅读:146      评论:0      收藏:0      [点我收藏+]

标签:

 1 #!/bin/sh
 2 
 3 fileName=$1
 4 cat ${fileName}|grep http://|awk -F URL> {print $2}>file.txt
 5 ##url为目录+文件的列表
 6 awk -F </ {print $1} file.txt>url.txt
 7 ##输出以/结尾的url,其中,\/$代表以/结尾的行,\用于转义。
 8 awk /\/$/ url.txt >dir.txt
 9 ##!代表取反,输出不以/结尾的行,即文件列表
10 awk !/\/$/ url.txt >file.txt
11 echo "resultfiles are in currentdir url.txt dir.txt file.txt"

 

wvs爬虫 目录和文件提取 导出

标签:

原文地址:http://www.cnblogs.com/changddcn/p/4969628.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!