以CSDN(https://blog.csdn.net/nav/career)为例,采集当前列表页博文的正文数据:第一步:新建任务①点击左上角“加号”新建任务,如图1:【图1】②在弹窗里填写采集地址,任务名称,如图2:【图2】③点击下一步,选择进行数据抽取还是链接抽取,本次采集当前列表页博文的正文数据,正文数据是通过点击列表链接进入的,所以本次需要抽取列表链接,所以点击抽取链接,如图3:【图3】第
分类:
其他好文 时间:
2019-01-27 14:46:27
阅读次数:
249
今天,小编来教大家如何采集论坛自媒体类网站的数据,以采集360问答为例,为大家进行演示操作,该操作同样适用于其他类似网站:第一步:新建任务①点击左上角“加号”新建任务,如图1:②弹窗里填写采集地址,任务名称,开启手动登录配置,如图2:若未在此处开启登录配置,可在模板抽取配置中点击相应的模板,开启登录配置,如图3。③点击下一步,选择进行数据抽取还是链接抽取,本次采集列表下的正文数据,所以本次需要抽取
分类:
其他好文 时间:
2019-01-27 14:44:20
阅读次数:
274
第一步:新建任务①点击左上角“加号”新建任务,如图1:【图1】②弹窗里填写采集地址,任务名称,开启手动登录配置,如图2:【图2】若未在此处开启登录配置,可在模板抽取配置中点击相应的模板,开启登录配置,如图3。【图3】③点击下一步,选择进行数据抽取还是链接抽取,本次采集列表下的正文数据,所以本次需要抽取内容选择链接列表,所以点击抽取链接,选择链接列表,如图4:【图4】④完成后模板抽取配置列表有两个模
分类:
Web程序 时间:
2019-01-27 14:43:11
阅读次数:
213
最近后台有很多童鞋问怎么采集新闻,今天小编以采集新浪新闻为例,来为大家进行演示,同样适用于其他新闻网站的采集,具体操作如下:第一步:新建任务①点击左上角“加号”新建任务,如图1:②在弹窗里填写采集地址,任务名称,如图2:③点击下一步,选择进行数据抽取还是链接抽取,本次采集当前列表页新闻的正文数据,正文数据是通过点击列表链接进入的,所以本次需要抽取列表链接,所以点击抽取链接,如图3:第二步:通过定位
分类:
其他好文 时间:
2019-01-27 14:36:19
阅读次数:
176
第一步:新建任务①点击左上角“加号”新建任务,如图1:【图1】②在弹窗里填写采集地址,任务名称,如图2:【图2】③点击下一步,选择进行数据抽取还是链接抽取,本次采集企业最新动态链接列表,所以点击抽取链接,选择链接列表,如图3:【图3】④完成之后,在模板抽取配置下生成两个模板,默认模板:01和链接列表:02。模板1中的“链接列表”链接抽取已与模板2关联,如图4。如果配置的时候发现关联有问题,可以自己
分类:
Web程序 时间:
2019-01-27 14:35:14
阅读次数:
254
第一步:新建任务①点击左上角“加号”新建任务,如图1:【图1】②弹窗里填写采集地址,任务名称,如图2:【图2】③点击下一步,选择进行数据抽取还是链接抽取,本次采集当前页面子栏目下的列表房源的正文数据,子栏目房源列表是通过点击子栏目链接进入的,所以本次需要抽取子栏目链接,所以点击抽取链接,选择子栏目,如图3:【图3】④完成后模板抽取配置列表有两个模板,默认模板和子栏目。默认模板下自动生成一个链接抽取
分类:
其他好文 时间:
2019-01-27 14:34:28
阅读次数:
182
昨天为大家介绍了如何采集图片/视频/资源文件后,有小伙伴问我如何采集他们的链接地址,今天小编就为大家演示如何采集图片/视频/资源文件的链接地址,操作如下:第一步:新建任务①点击左上角“加号”新建任务,如图1:②在弹窗里填写采集地址,任务名称如图2:③点击下一步,选择进行数据抽取还是链接抽取,本次采集所有页面的图片,图片链接是通过点击图片列表链接进入的,所以本次需要抽取列表图片链接,所以点击抽取链接
分类:
其他好文 时间:
2019-01-27 11:29:31
阅读次数:
274
第一步:新建任务①击左上角“加号”新建任务,如图1:【图1】②在弹窗里填写采集地址,任务名称如图2:【图2】③点击下一步,选择进行数据抽取还是链接抽取,本次采集需要采集当前页面列表中的所有内容,所以只需抽取列表数据即可,点击“抽取数据”,如图3:【图3】第二步:创建/选择表单在ForeSpider爬虫中,表单是可以复用的,所以可以在数据表单出直接选择之前建过的表单,也可以通过表单ID来进行查找并关
分类:
其他好文 时间:
2019-01-09 11:44:47
阅读次数:
251
第一步:新建任务①点击左上角“加号”新建任务,如图1:【图1】②在弹窗里填写采集地址,任务名称如图2:【图2】③点击下一步,选择进行数据抽取还是链接抽取,本次采集当前列表页新闻的正文数据,正文数据是通过点击列表链接进入的,所以本次需要抽取列表链接,所以点击抽取链接,如图3:【图3】第二步:通过智能过滤,得到所需链接。①按住Ctrl+鼠标左键点击所需链接;②击“智能过滤”按钮,如图4:【图4】第三步
分类:
其他好文 时间:
2019-01-09 11:36:47
阅读次数:
241
以孔夫子旧书网的最近出版板块为例(http://www.kongfz.com/1004/)为例,采集列表页的所有数据:第一步:新建任务①击左上角“加号”新建任务,如图1:②在弹窗里填写采集地址,任务名称如图2:③点击下一步,选择进行数据抽取还是链接抽取,本次采集需要采集当前板块的列表页所有内容,所以只需要在同一个模板中进行翻页链接抽取以及数据抽取即可。此处需要勾选“抽取链接”-“普通翻页”以及“抽
分类:
其他好文 时间:
2019-01-09 11:15:14
阅读次数:
949