码迷,mamicode.com
首页 > 编程语言 > 详细

Python使用代理的方法

时间:2018-12-18 20:29:29      阅读:212      评论:0      收藏:0      [点我收藏+]

标签:orb   serve   .com   png   href   就是   free   bin   设置   

我们在做爬虫的过程中经常会遇到这样的情况:最初爬虫正常运行,正常抓取数据,一切看起来都是那么的美好,然而一杯茶的功夫可能就会出现错误,比如403 Forbidden;出现这样的原因往往是网站采取了一些反爬虫的措施,比如,服务器会检测某个IP在单位时间内的请求次数,如果超过了某个阈值,那么服务器会直接拒绝服务,返回一些错误信息。这时候,代理就派上用场了。

国内的免费代理网站:

西刺代理

快代理免费代理

全网代理ip

接下来看如何设置代理:

urllib代理设置:

from urllib.error import URLError
from urllib.request import ProxyHandler,build_opener

proxy=123.58.10.36:8080  #使用本地代理
#proxy=‘username:password@123.58.10.36:8080‘  #购买代理
proxy_handler=ProxyHandler({
    http:http://+proxy,
    https:https://+proxy
})
opener=build_opener(proxy_handler)
try:
    response=opener.open(http://httpbin.org/get) #测试ip的网址
    print(response.read().decode(utf-8))
except URLError as e:
    print(e.reason)

运行结果如下:

技术分享图片

 

requests代理设置:

import requests

proxy=123.58.10.36:8080  #本地代理
#proxy=‘username:password@123.58.10.36:8080‘
proxies={
    http:http://+proxy,
    https:https://+proxy
}
try:
    response=requests.get(http://httpbin.org/get,proxies=proxies)
    print(response.text)
except requests.exceptions.ConnectionError as e:
    print(错误:,e.args)

运行结果如下:

技术分享图片

 

Selenium代理设置:

from selenium import webdriver


proxy=123.58.10.36:8080
chrome_options=webdriver.ChromeOptions()
chrome_options.add_argument(--proxy-server=http://+proxy)
browser=webdriver.Chrome(chrome_options=chrome_options)
browser.get(http://httpbin.org/get)

运行结果:

技术分享图片

以上就是代理的一些简单设置、、、

 

Python使用代理的方法

标签:orb   serve   .com   png   href   就是   free   bin   设置   

原文地址:https://www.cnblogs.com/yuxuanlian/p/10139659.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!