标签:imp utf-8 http code rod url 安装 字符类型 class
Requests库为python的外部库,话不多话,直接开干吧!
首先是安装requests库,很简单不说了。
文件,引入requests库:
import requests
下面来看一个简单的例子吧:
#一个最简单的爬虫小程序,这里只到获得源html文件结束
import requests
url1="https://live.500.com/" #ISO-8859-1
url2="https://www.baidu.com/" #ISO-8859-1
url3="https://study.163.com/course/introduction.htm?courseId=1209448892#/courseDetail?tab=1" #UTF-8
url4="http://www.cwl.gov.cn/kjxx/ssq/kjgg/" #ISO-8859-1
re=requests.get(url3)
if re.status_code==200: #如果请求成功,那返回的状态码就是200。
#表示请求成功,可以继续往下面走
# print(re.text) #可能会有乱码,因为编码的问题
# print(re.encoding) #得到字符编码UTF-8 or ISO-8859-1
if re.encoding=="ISO-8859-1": #如果是这个编码的话,字集应该是gb2312,就要转一下码,不然会有中文乱码问题
html=re.text.encode("ISO-8859-1").decode("GBK") #先编码,再解码
else:
html=re.text #utf-8,这个直接用,没有中文乱码问题
print(html)
else: #请求不成功。
print("访问失败,换个URL试吧!")
#_________________________________________________________________________________________
re.text #返回的是字符类型
re.content #返回的是字节类型,这一类用于图片啊,声音啊,视频等
上面的例子是requests库发出的一个get请求,也可以发送一个post请求:
re=requests.post(url3,data={"key":"value"}) #参数跟一个字典即可。
还有几个http请求如下:
re = requests.put(‘http://www.baidu.com‘, data = {‘key‘:‘value‘})
re = requests.delete(‘baidu.com‘)
re = requests.head(‘www.baidu.com‘)
re = requests.options(‘http://www.sina.com.cn‘)
未完待续...
标签:imp utf-8 http code rod url 安装 字符类型 class
原文地址:https://www.cnblogs.com/yiyea/p/11441107.html