码迷,mamicode.com
首页 > 编程语言 > 详细

python爬虫5--requests请求库

时间:2020-01-04 10:48:36      阅读:61      评论:0      收藏:0      [点我收藏+]

标签:安装   登录验证   files   json格式   user   连接   爬虫   下一步   nbsp   

使用该库需先安装,能更方便的处理Cookies,登录验证,代理设置等。

urllib中urlopen()实际是以GET方法请求网页,requests中响应的方法为get(),另外还可用post(),put(),delete()等方式实现POET,PUT,DELETE等请求。

1 普通用法

1.1 GET请求

技术图片

 

 

 

 如果网页返回的是JSON格式,可以调用json()方法转变成字典格式。

1.2 POST请求

技术图片

 

 1.3 属性

  • requests的属性:
  • text和content:响应的内容;
  • status_code:状态码;
  • headers:响应头;
  • cookies:Cookies信息;
  • url:url;
  • history:请求的历史

2 高级用法

2.1 文件上传

代码:

import requests

files = {‘file’:open(‘文件名‘,‘rb)}

res = requests.post(url,files=files)

2.2 Cookies

登录后将headers里的cookies内容复制下来,封装在headers中,来维持登录状态。

2.3 会话维持

利用Session,可以模拟同一个会话,通常用于模拟登录成功之后再进行下一步操作。

2.4 SSL证书验证

可以在发送请求时加一个verify参数,默认True。

2.5 代理设置

用proxies参数

2.6 超时设置

timeout参数,默认为None。请求分为连接和读取两个阶段,timeout设置的时间为两个阶段的总和

2.7 身份验证

req = requests.get(url,auth=(‘username‘,‘userpass‘)

 

 

python爬虫5--requests请求库

标签:安装   登录验证   files   json格式   user   连接   爬虫   下一步   nbsp   

原文地址:https://www.cnblogs.com/rong1111/p/12143007.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!