标签:打开 路径 png teleport 选择 tle inf port 类型
之前领导安排了一任务,就是想要把一网站上的东西爬下来,然后改点东西,自己再做一个静态站放到自己的内建服务器上;
其实就想想看这种需求其实却是还蛮多的;
因此一个强大的网站爬虫还是需要的:
推荐
下载地址:https://pan.baidu.com/s/1lDN47o6GeR4uKFB9xOqGUQ
下载完成后一路安装即可:
打开软件操作界面:
首先点击这个新建向导:
第一个单选:在我的硬盘中创建一个可浏览的网站
第二个单选:复制一个网站,包含该网站的目录结构
第三个单选:在一个网站中搜索指定的文件类型
第四个单选:从一个中心站点探测每一个链接的站点
第五个单选:在已知地址下载一个或多个文件
第六个单选:在一个网站中搜索指定关键字
** 这里我们使用第一个或者第二个都可以,都能够拉取静态资源,第一个下载的内容会直接将所有文件放入一个文件夹中,第二个会自动创建对应的目录,我们选择第一个**
第三步:
第四步:
第五步:
点击完成后选择保存文件路径;
第六步:
启动复制;
就可以看到爬下来站点的东西了;
但是我在爬取某个页面时也出现了无法爬取的错误,不知道是什么问题。
标签:打开 路径 png teleport 选择 tle inf port 类型
原文地址:https://www.cnblogs.com/LeeSki/p/14188715.html