码迷,mamicode.com
首页 > 其他好文 > 详细

编码与解码

时间:2018-08-02 16:05:11      阅读:112      评论:0      收藏:0      [点我收藏+]

标签:解码   技术分享   unicode   长度   style   英文   ascll   图片   bit   

 
8bit(位) = 1byt(字节)    1024byte=1Mb   1024Mb=1G  
ascll 最早的编码 8位一个字节(字符和符号,无中文)
GBK 国标码       16位4个字节(字符和中文和符号)
nuicode 万国码 32位8个字节 (字符和中文和符号)
UTF-8 可变长度unicode  英文8位1个字节   欧洲文字16位2个字节 汉字24位3个字节
一个英文占一个字节,一个中文占三个字节
技术分享图片
unicode --> bytes    encode()         转码 str.encode(‘utf-8‘)    str.encode(‘gbk‘)
bytes   --> unicode  decode()         转码 str.decode(转换前的编码)转换回去
 
gbk与UTF-8是无法互相转换的,只能通过unicode来转换
s1 = b\xd6\xd0\xb9\xfa
s2 = s1.decode(gbk)
print(s2.encode(utf-8))
或链式写法
s1 = b\xd6\xd0\xb9\xfa.decode(gbk).encode(utf-8)
print(s1)

 

编码与解码

标签:解码   技术分享   unicode   长度   style   英文   ascll   图片   bit   

原文地址:https://www.cnblogs.com/Mr-wangxd/p/9407334.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!