码迷,mamicode.com
首页 > 其他好文 > 详细

爬虫3-Requests库的主要方法

时间:2018-03-27 22:01:03      阅读:176      评论:0      收藏:0      [点我收藏+]

标签:internet   border   爬虫   ram   解析   分享   传输协议   headers   alt   

Requests库的7个主要方法:

方法 说明
requests.request() 构造一个请求,支撑以下各方法的基础方法
requests.get() 获取HTML网页的主要方法,对应于HTTP的GET
requests.head() 获取HTML网页头信息的方法,对应HTTP的HEAD
requests.post() 向HTML网页提交POST请求的方法,对应于HTTP的POST
requests.put() 向HTTP网页提交PUT请求的方法,对应于HTTP的PUT
requests.patch() 向HTTP网页提交局部修改请求,对应于HTTP的PATCH
requests.delete() 向HTTP页面提交删除请求,对应于HTTP的DELETE

 

 

 

 

 

 

 

HTTP协议:超文本传输协议

URL是通过HTTP协议存取资源的Internet路径,一个url对应一个数据资源

HTTP对资源的操作有6个方法,与上表对应。

技术分享图片

 

PATCH和PUT的区别:

技术分享图片

HTTP协议方法与Requests库方法具有功能的一致性

head方法 用很少的流量获取网络的概要信息

技术分享图片

 Requests库主要方法解析:

1、requests.request(method,url,**kwargs)

method:表示get head 等方法

url 表示路径

**kwargs  表示其他13个参数 控制访问的参数,均为可选项

比如params 对url进行修改的字段

data:字典、字节序列或文件,Request的内容

json:JSON格式的数据,作为Request的内容

kv={key1:value1}
r=requests.request(POST,http://python123.io/ws,json=kv)

headers:字典,HTTP定制头

hd={user-agent:Chrome/10}#表示将user-agent改为Chrome/10
r=requests.request(POST,http://python123.io/ws,headers=hd)

还有其他的一些字段,在这里不详述。

掌握get和head方法即可。

一定要用try except保证正常访问以及异常处理。

 

爬虫3-Requests库的主要方法

标签:internet   border   爬虫   ram   解析   分享   传输协议   headers   alt   

原文地址:https://www.cnblogs.com/rayshaw/p/8563516.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!