码迷,mamicode.com
首页 > 编程语言 > 详细

手把手教你:解决python UnicodeDecodeError: 'gb2312' codec can't decode问题

时间:2015-06-16 11:11:19      阅读:545      评论:0      收藏:0      [点我收藏+]

标签:python   unicodedecodeerror   gbk   gb2312   python字符编码错误   

问题:UnicodeDecodeError: ‘gb2312‘ codec can‘t decode bytes in position 2-3: illegal multibyte sequence

原因:python在做将普通字符串转换为unicode对象时,

例如:u_string = unicode(string , "gb2312"),如果你的字符串string中有诸如某些繁体字,例如"河滘小学"

中的滘,那么gb2312作为简体中文编码是不能进行解析的,必须使用国标扩展码gbk,gbk支持繁体中文和日文假文


解决方法:使用gbk,代替gb2312,例如:u_string = unicode(string , "gbk")

手把手教你:解决python UnicodeDecodeError: 'gb2312' codec can't decode问题

标签:python   unicodedecodeerror   gbk   gb2312   python字符编码错误   

原文地址:http://blog.csdn.net/qingyuanluofeng/article/details/46514119

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!