码迷,mamicode.com
首页 > 编程语言 > 详细

python3.6使用chardet模块总是报错ValueError: Expected a bytes object, not a unicode object

时间:2017-09-22 17:50:27      阅读:1400      评论:0      收藏:0      [点我收藏+]

标签:not   编码   类型   格式   编码格式   gbk   获取   bytes   obj   

py3里,字符串,str类型,是unicode编码格式。其他类型都是byte,编码格式是gbk,utf-8等

而chardet是检查byte类型的编码格式的,不是检查str类型的编码格式的。

a="abc啊”,是字符串,就不能用chardet了。

当获取的数据(byte)类型,需要当成字符串来处理,需要先将其编码成unicode(python处理的都是此编码)。

而要将bytes转换成unicode,需要先知道bytes具体是什么编码格式如gbk,然后使用aa=decode("gbk"),aa为unicode的该数据内容。

如果很不幸,你有一堆bytes,不知道它们的编码(例如 网站服务器返回的响应体),
这时候,你就需要chardet 来测试它们的编码。

python3.6使用chardet模块总是报错ValueError: Expected a bytes object, not a unicode object

标签:not   编码   类型   格式   编码格式   gbk   获取   bytes   obj   

原文地址:http://www.cnblogs.com/gwj99/p/7575571.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!