标签:.text 分享图片 stat ons www. iso 请求 header time
import requests #导入模块
print(response.status_code) #打印状态码
print(response.url) #打印请求url
print(response.headers) #打印头部信息
print(response.cookies) #打印cookie信息
print(response.text) #以文本形式打印网页源码
print(response.content) #以字节流形式打印网页源码
headers = {‘User-Agent‘:‘Mozilla/5.0(Windows NT 6.1;W...) Genko/201000101 Firefox/59.0‘}
response = requests.get(url,headers) #发送网络请求
print(response.content) #以字节流形式打印网页源码
网络超时
for a in range(0,50):
try: #捕获异常
#设置超时时间为0.5s
print(response.status_code) #打印状态码
except Exception as e: #捕获异常
print(‘异常‘+str(e)) #打印异常信息
代理服务
proxy = {‘http‘:‘122.114.31.177:808‘,
‘https‘:‘122.114.31.177:8080‘} #设置代理ip对应的端口号
#对需要爬取的网页发送请求
print(response.content) #以字节流形式打印出网页源码
简单爬虫
标签:.text 分享图片 stat ons www. iso 请求 header time
原文地址:https://www.cnblogs.com/heiguu/p/9951568.html