标签:数据 方法 ima 信息 一般来说 图片下载 images ges scrapy
Scrapy为下载item中包含的文件(比如在爬取到产品时,同时也想保存对应的图片)提供了一个可重用的item pipelines
。这些pipeline
有些共同的方法和结构我们称之为media pipeline
。一般来说你会使用Files Pipline
或者Images Pipeline
。
scrapy
内置的下载文件的方法File Pipeline
:当使用Files Pipline
下载文件的时候,按照以下步骤来完成:
Item
,然后在这个item
中定义两个属性,分别为file_urls
以及files
。file_urls
是用来存储需要下载的文件的url链接,需要给一个列表。item
的files
属性中。比如下载路径、下载的url和文件的效验码等。settings.py
中配置FILES_STORE
,这个配置是用来设置文件下载下来的路径。pipeline
:在ITEM_PIPELINES
中设置scrapy.pipelines.files.FilesPipline:1
。Images Pipline
:当使用Images Pipeline
下载文件的时候,按照以下步骤来完成:
Item
,然后在这个item
中定义两个属性,分别为image_urls
以及images
。image_urls
是用来存储需要下载的文件的url链接,需要给一个列表。item
的images
属性中。比如下载路径、下载的url和文件的效验码等。settings.py
中配置IMAGES_STORE
,这个配置是用来设置图片下载下来的路径。pipeline
:在ITEM_PIPELINES
中设置scrapy.pipelines.images.ImagesPipline:1
标签:数据 方法 ima 信息 一般来说 图片下载 images ges scrapy
原文地址:https://www.cnblogs.com/colden/p/9863810.html