标签:中文 字节 32bit 编码 pytho 默认 效率 ascii sci
一 . 几种主要的编码:
ASCII:1个字节(byte),8bit;
GBK(国标码):2个字节,16bit;
unicode(万国码):4个字节,32bit;
utf-8:是Unicode的简化版,效率较高,每个字符最少占8bit.英文--1个字节;欧洲字母--2个字节;中文--三个字节
utf-16:每个字符最少占16bit.
二. python的编码
2.x的编码是默认以ASCII编码,对于中文不友好;3.x默认是utf-8,一般就不用纠结编码的问题了.
python在内存中使用Unicode,传输和保存用的是utf-8.
标签:中文 字节 32bit 编码 pytho 默认 效率 ascii sci
原文地址:https://www.cnblogs.com/DoingBe/p/9270250.html