码迷,mamicode.com
首页 > 编程语言 > 详细

Python 爬虫常见的坑和解决方法

时间:2018-01-06 17:13:23      阅读:222      评论:0      收藏:0      [点我收藏+]

标签:请求   ref   erro   open   for   article   方法   rac   gen   

1.请求时出现HTTP Error 403: Forbidden

headers = {‘User-Agent‘:‘Mozilla/5.0 (Windows NT 6.1; WOW64; rv:23.0) Gecko/20100101 Firefox/23.0‘}  

req = urllib.request.Request(url=url, headers=headers)  

urllib.request.urlopen(req).read()  

详细:https://www.2cto.com/kf/201309/242273.html

 

2.保存html内容时出现Python UnicodeEncodeError: ‘gbk‘ codec can‘t encode character

f = open("out.html","w")  

换成

f = open("out.html","w",encoding=‘utf-8‘)  

详细:http://www.jb51.net/article/64816.htm

 

Python 爬虫常见的坑和解决方法

标签:请求   ref   erro   open   for   article   方法   rac   gen   

原文地址:https://www.cnblogs.com/cxscode/p/8214578.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!