标签:pre 教程 用户名 源码编译安装 这一 软件包安装 名称 软件 显示
今天一位网友突然在deepin群里问怎么抓取一个站点。他自己用的wget尝试了一下,太繁琐。失败了。有网友建议他学习爬虫技术的,也有说右键保存的,直到有个网友提到了webhttrack这个工具。 $ sudo apt-get install webhttrack
安装完直接在终端下运行就行了:
$ webhttrack
然后会启动一个浏览器引导着你一步一步完成一个网站的抓取。1、2、3……step by step超级简单。
下面以一个实例来展示一下webhttrack的应用。我们以抓取菜鸟网中的一个c++学习部分内容为例来展开。
标签:pre 教程 用户名 源码编译安装 这一 软件包安装 名称 软件 显示
原文地址:http://blog.51cto.com/mingzhuantou/2322264