码迷,mamicode.com
首页 > 编程语言 > 详细

python3 requests爬取gbk时候遇到编码的坑

时间:2019-08-31 19:42:01      阅读:498      评论:0      收藏:0      [点我收藏+]

标签:request   python3   表示   爬取   highlight   乱码   code   编码转换   str   

python3默认是utf8的,爬取gbk网页的时候会出现乱码 

解决办法 

test.encoding="gbk"
test.text

text不转换会出现错误,python3字符集不支持转码

第二种方法

test.content.decode("gbk")

decode的作用是将其他编码的字符串转换成unicode编码,如str1.decode(‘gb2312‘),表示将gb2312编码的字符串str1转换成unicode编码。 解码

encode的作用是将unicode编码转换成其他编码的字符串,如str2.encode(‘gb2312‘),表示将unicode编码的字符串str2转换成gb2312编码。 编码

python3 requests爬取gbk时候遇到编码的坑

标签:request   python3   表示   爬取   highlight   乱码   code   编码转换   str   

原文地址:https://www.cnblogs.com/xxxuxin/p/11439891.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!