码迷,mamicode.com
首页 > 其他好文 > 详细

编码的种类与发展史及其表现形式

时间:2018-08-09 21:20:19      阅读:251      评论:0      收藏:0      [点我收藏+]

标签:nio   lex   使用   存储   硬盘   nic   xe7   资源   环境   

编码二
ascii: 字母,数字,特殊字符。
A: 0000 0010
B: 0000 0010
unicode: 万国码,包含世界上所有的文字。
创建之初:
A :0000 0010 0000 0010
中:0001 0010 0000 0010
升级:
A :0000 0010 0000 0010 0000 0010 0000 0010 32 位
中:0001 0010 0000 0010 0000 0010 0000 0010
浪费资源。
对unicode 升级:utf-8
A :0000 0010 8位
欧:0000 0010 0000 0010 16位
中:0000 0010 0000 0010 0000 0010 24位

gb2312: 国标:字母,数字,特殊字符,中文。
A :0000 0010 8位
中:0000 0010 0000 0010 16位

1, 编码之间能不能互相识别。 不能互相识别。
2, 网络传输,或者硬盘存储的010101,必须是以非uniocde编码方式的01010101.

大环境python3x:
str:内存(内部)编码方式为Unicode。
bytes:python的基础数据类型之一,他和str相当于双胞胎,str拥有的所有方法,bytes类型都适用。

int
tuple
list
dict
set
区别:
英文字母:
str:
表现形式:s1 = ‘alex‘
内部编码方式:unicode


bytes:
表现形式:b1 = b‘alex‘
内部编码方式:非unicode

中文:
str:
表现形式:s1 = ‘太白‘
内部编码方式:unicode


bytes:
表现形式:b1 = b‘\xe5\xa4\xaa\xe7\x99\xbd‘
内部编码方式:非unicode

如何使用:
你想将一部分内容(字符串)写入文件,或者通过网络socket传输,这样这部分内容(字符串)必须转化成bytes才可以进行。
平时你代码中,使用字符串。

编码的种类与发展史及其表现形式

标签:nio   lex   使用   存储   硬盘   nic   xe7   资源   环境   

原文地址:https://www.cnblogs.com/Clara51/p/9451357.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!