码迷,mamicode.com
首页 > 其他好文 > 详细

八爪鱼采集列表和详情信息

时间:2018-12-15 12:00:38      阅读:258      评论:0      收藏:0      [点我收藏+]

标签:tab   def   账号   and   .com   工具   流程   元素   isp   

  前两天突然接到领导一个邮件,让我用八爪鱼采集互联网数据。下面是邮件的原话:

技术分享图片

  我是接触可视化工具较多,但是你这个应该不复杂就有点主观了吧,没办法,让我对应就对应吧。

  首先登陆官网:http://www.bazhuayu.com/,下载客户端安装,傻瓜式安装下一步下一步就完成了。我不需要免费账号,公司买了一个。

技术分享图片

  这是这个工具的界面,还是蛮简洁的,最主要的是任务栏和工具箱栏。任务栏首先可以建立任务组,在任务组下面建立具体的任务。下面我就具体的某一任务来一一说明。

  我采集的是中国土地市场网的结果公示,网址为http://www.landchina.com/default.aspx?tabid=263&ComName=default,页面如图:

技术分享图片

  需要采集的信息是列表内容和点进去列表后的详情,当然我的例子是列表选一个,详情选一个。还有一点,这个列表需要翻页,一共200页,每页30条。

1,建立任务:点击新建,选择自定义采集,输入网址,点击保存。

技术分享图片

出来的页面是这样:

技术分享图片

2,现在我要把序号这一列采集下来,鼠标点击1.,然后选择选中全部:

技术分享图片

再选择采集以下元素文本。至此,列表的信息可以采集了。

技术分享图片

2,点击钻取到详情列的超链接,然后选择点击该链接:

技术分享图片

 下面会跳转到详情页,我再采集项目名称,单击对应文本,选择采集该元素的文本,至此详情的信息可以采集了。

技术分享图片

3,我们的采集工作完成了,但是我们还差翻页循环,点击返回上个页面:

技术分享图片找到下页按钮,点击,然后选择循环单击单个链接:

技术分享图片

 然后点击左上角保存,全部步骤完成,我们可以看一下流程图:

技术分享图片

这样一个采集任务就完成了,接下来就可以点击开始采集按钮测试了。

技术分享图片

 

八爪鱼采集列表和详情信息

标签:tab   def   账号   and   .com   工具   流程   元素   isp   

原文地址:https://www.cnblogs.com/caozx/p/10121645.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!