码迷,mamicode.com
首页 > 其他好文 > 详细

编码的小知识

时间:2018-08-04 18:51:48      阅读:134      评论:0      收藏:0      [点我收藏+]

标签:字节   python3   方式   识别   进制   sci   bytes   一个   code   

编码方式:

ASCII

a  8位  一个字节

unicode

a  32位  四个字节

中  32位  四个字节

utf-8

a  8位  一个字节

中  24位  三个字节

gbk

a  8位  一个字节

中  16位  两个字节

1.各个编码之间的二进制,是不能相互识别的,会产生乱码。

2.文件的传输,储存不能是unicode(只能是utf-8,utf-16,gbk,gbk2312,ascii等)

Python3

str 在内存中使用unicode编码

对于英文:

  str:  表现方式:s = ‘alex’

      编码方式:01010101    unicode

  bytes: 表现方式:s = b“alex”

       编码方式:01010100    utf-8,gbk。。。

对于中文:

  str:  表现方式;s = “中国”

      编码方式:01010101  unicode

  bytes: 表现方式:s = b‘x\e93\e91\e30\e02\e32\e42‘

       编码方式:00010001  utf-8,gbk。。。

编码的小知识

标签:字节   python3   方式   识别   进制   sci   bytes   一个   code   

原文地址:https://www.cnblogs.com/albatorss/p/9419238.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!