码迷,mamicode.com
首页 > 其他好文 > 详细

字符编码

时间:2015-01-29 11:51:47      阅读:150      评论:0      收藏:0      [点我收藏+]

标签:

1.unicode: 2或4字节

  

>>> print u‘\u4e2d‘   # 4e2d ,unicode

2.utf-8 : 1到6字节 ,常用的英文字母被编码成1个字节,汉字通常是3个字节,只有很生僻的字符才会被编码成4-6个字节,

ASCII编码实际上可以被看成是UTF-8编码的一部分

3.unicode--------> utf-8   : u‘中文‘.encode(‘utf-8‘)

  utf-8-------->  unicode   :xxx.decode(‘utf-8‘)

 unicode--------> gbk   : u‘中文‘.encode(‘gb2312‘)

  gbk-------->  unicode :  unicode(xxx,‘gb2312‘)    

字符编码

标签:

原文地址:http://www.cnblogs.com/Citizen/p/4259063.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!