码迷,mamicode.com
首页 > 其他好文 > 详细

Scrapy改成Scrapy-Redis

时间:2019-02-03 12:28:00      阅读:187      评论:0      收藏:0      [点我收藏+]

标签:容器   lte   容器类   spi   item   爬取   lin   nes   数据   

1. 增加去重容器类配置,
DUPEFILTER_CLASS = “scrapy_redis.dupefilter.RFPDupeFilter”

2. 增加调度配置,
SCHEDULER = “scrapy_redis.scheduler.Scheduler”

3. 配置调度器持久化, 爬虫结束, 要不要清空Redis中请求队列和去重指纹的set。如果True, 就表示要持久化存储, 否则清空数据
SCHEDULER_PERSIST = True

ITEM_PIPELINES = { 
# 把爬虫爬取的数据存储到Redis数据库中 
‘scrapy_redis.pipelines.RedisPipeline’: 400, 
}

Scrapy改成Scrapy-Redis

标签:容器   lte   容器类   spi   item   爬取   lin   nes   数据   

原文地址:https://www.cnblogs.com/liubosong/p/10350035.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!