码迷,mamicode.com
首页 > 其他好文 > 详细

scrapy

时间:2020-06-11 16:09:43      阅读:59      评论:0      收藏:0      [点我收藏+]

标签:utf-8   文本   tin   orm   tor   scrapy   数据   lin   htm   

使用 xpath 选择网页所使用的标签

 request传递数据 

html response 

 formrequest  使用  登录界面   

内容存储为json lines 文件  

   setting 文件设置实现   保存在json 文件中

LOG_FORMAT  日志的格式  

LOG_DATEDORMAT  日志日期的格式

class 

scrapy.statscollectors.MemortStatsCollector

用来获取  内存的使用情况  

可以使用文本文件

csv文件 json 文件  jsonlines文件  数据库文件 云存储

 

创建 scrapy  文件  命令是  scrapy startproject collectips

每一行都要进行  “#-*-coding: utf-8 -*-  进行注释

 

scrapy

标签:utf-8   文本   tin   orm   tor   scrapy   数据   lin   htm   

原文地址:https://www.cnblogs.com/soyadios/p/13093634.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!