标签:天天向上 类型 unicode编码 字符 解码 2-2 ring 转码 nbsp
1.py3声明的变量默认是unicode编码,默认文件编码是utf-8
2.unicode分为 utf-32(占4个字节),utf-16(占2个字节),utf-8(占1-4个字节),所以utf-16是现在最常用的unicode版本, 不过在文件里存的还是utf-8,因为utf-8省空间
3.在py3中encode,在转码的同时还会把string 变成bytes类型,decode在解码的同时还会把bytes变回string,在py3里,str and bytes做了明确的区分
str=u‘好好学习天天向上‘ #加u表示unicode,默认也是unicode
utf-8_to _gbk = str.decode(‘utf-8‘).encode(‘gbk‘)
标签:天天向上 类型 unicode编码 字符 解码 2-2 ring 转码 nbsp
原文地址:http://www.cnblogs.com/shengxinjack/p/7735729.html