标签:链接 重复项 超链接 linu 递归 help log eject always
lynx命令是纯文本模式的网页浏览器。可以在linux命令行模式下直接输入lynx URL
访问某个网站,
yum list | grep lynx ## 有结果返回说明可以用yum安装
yum -y install lynx ## 安装
lynx - a general purpose distributed information browser for the World Wide Web
语法:
lynx [options] [path or URL]
--
lynx [options] [path or URL] -get_data
data
--
lynx [options] [path or URL] -post_data
data
--
Use "lynx -help" to display a complete list of current options.
lynx http://www.baidu.com ## 使用 -accept_all_cookies 选项可以跳过后面的操作。
这里会提示是否上传cookie:... ,选择(Y/N/Always/neVer)任一输入都行的,浏览器通过cookie记录用户的一些非敏感信息,比如搜索的偏好等。 之后会以文本模式打开浏览器:
除了不能直接用鼠标点击,需要使用上下键进行移动,其他操作都和正常使用浏览器差不多(当然不建议这么玩,因为显示的内容不是很方便阅读。但既然是使用linux命令行,那么我们真正在乎的就只是这个工具它所实现的功能,而不是图形界面下才有的感觉)。
-traversal 选项,能够以递归的方式访问网站并建立网站中所有超链接的列表;执行:lynx -traversal URL
,会在工作目录下生成数个文件,其中 reject.dat 文件包含网站中所有链接。配合 sorrt -u reject.dat > xx.txt
命令,建立一个不包含重复项的该网站所有链接的列表。
-dump 选项,以纯文本的形式输出网页的内容。
标签:链接 重复项 超链接 linu 递归 help log eject always
原文地址:http://blog.51cto.com/11960994/2294185