码迷,mamicode.com
首页 > 编程语言 > 详细

python 编码问题记录

时间:2015-10-08 20:13:17      阅读:542      评论:0      收藏:0      [点我收藏+]

标签:

1,AttributeError: ‘str‘ object has no attribute ‘decode‘,:

decode              encode

bytes ------> str(unicode)------>bytes

decode的目标要死bytes!

2,UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xb7 in position 0: invalid start byte

常看到这种:\xb7\xfb\xe5\xab

>>> a=‘符瀚‘

>>> a.encode(‘gb2312‘)

b‘\xb7\xfb\xe5\xab‘

>>> a.encode(‘utf-8‘)

b‘\xe7\xac\xa6\xe7\x80\x9a‘

由此可见utf-8和gb2312来编译中文的时候都是类似"\x"开头。

这个错误就是使用编码解码不对,可以尝试用gb2312来解码。

3."\u65e0\u6cd5\u901a\u8fc7\u626b\u7801\u627e\u5230“

SyntaxError: EOL while scanning string literal引号错误中文的……

这种是unicode格式,win下不知道为啥不正常了,正常转为为 b = a.encode(‘utf-8‘).decode(‘utf-8‘)就可以了


python 编码问题记录

标签:

原文地址:http://my.oschina.net/u/2367514/blog/514418

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!