码迷,mamicode.com
首页 > 其他好文 > 详细

selenium+scrapy完成爬取特定的知乎界面,比如我爬取的就是搜索“”“某某某东西”

时间:2018-03-07 15:02:32      阅读:277      评论:0      收藏:0      [点我收藏+]

标签:blog   爬取   res   地方   spider   帮助   gpo   post   建立   

这个地方非常感谢此篇作者的帮助 :http://blog.csdn.net/uselym/article/details/52525025

一、建立一个scrapy框架的爬虫

二、在spider中首先构造登录

技术分享图片

二、使用response构造需要获取到的数据

技术分享图片

三、在parse函数中返回request请求。

四、在scrapy.Request()中指定url=“你需要爬取的界面”

总结:对于知乎的动态界面,scrapy爬虫爬取始终没有selenium模拟上下滑动获取的比较完整,望注意。

 

selenium+scrapy完成爬取特定的知乎界面,比如我爬取的就是搜索“”“某某某东西”

标签:blog   爬取   res   地方   spider   帮助   gpo   post   建立   

原文地址:https://www.cnblogs.com/rabbit-working/p/8521713.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!