码迷,mamicode.com
首页 > 其他好文 > 详细

03 数据模型Item

时间:2019-10-17 17:24:31      阅读:76      评论:0      收藏:0      [点我收藏+]

标签:data   蜘蛛   asc   class   ext   之间   space   theme   last   

来自官网的诠释:
爬取的主要目标就是从非结构性的数据源中提取结构性数据, 如网页. Scrapy提供Item类来满足这样的需求.
Item对象是一种简单的容器, 保存了爬取到的数据,
其提供了类似于词典的API, 以及用于声明可用字段的简单语法
 
Item是一种数据容器, 是作为蜘蛛与管道之间的数据载体, 蜘蛛对收集的数据结构进行分析后提取出具体的数据结构并生成对应的Item实例,然后由Scrapy引擎传递给对应的管理进行后处理.
 
声明Item
Item使用简单的class定义语法和Field对象来进行声明
 
Item字段 (item fields)
import scrapy
class Product(scrapy.Item):
    name = scrapy.Field()
    price = scrapy.Field()
    stock = scrapy.Field()
    last_updated = scrapy.Field(serializer=str)

 

 

03 数据模型Item

标签:data   蜘蛛   asc   class   ext   之间   space   theme   last   

原文地址:https://www.cnblogs.com/zhangjian0092/p/11693100.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!