标签:
0,
utf-8占3个byte
Unicode占2个byte,而且较为智能,字符自动占一个字符
anscii占1个byte
?
1,实例
>>>name=‘马明‘ #xshell默认存成了utf8
>>>name
>>>‘\xe9\xa9\xac\xe6\x98\x8e‘
>>>
>>>print ‘\xe9\xa9\xac\xe6\x98\x8e‘ #可以直接打印utf8
>>>马明
>>>
>>>type(name)
>>>str
>>>
?
2,定义Unicode编码
2.1从utf-8转换到Unicode
>>>name.decode(‘utf-8‘)
>>>u‘\u9a6c\u660e‘
?
#name本身存成了utf8编码
将name解码成Unicode
>>>b=name.decode(‘utf-8‘)
>>>
>>>b
>>>u‘\u9a6c\u660e‘
>>>
#将Unicode编码成utf-8
>>>b.encode(‘utf-8‘)
>>>‘\xe9\xa9\xac\xe6\x98\x8e‘
#####文件里使用#coding=utf8
2.2自己指定存放编码
>>>name=u‘马明‘
标签:
原文地址:http://www.cnblogs.com/iiiiher/p/5840637.html