码迷,mamicode.com
首页 > 编程语言 > 详细

Python学习----字符集编码

时间:2018-08-18 19:50:00      阅读:147      评论:0      收藏:0      [点我收藏+]

标签:utf-8   unicode   操作   进制   ascii   用两个   之间   编码   没有   

1 ASCII码: American Standard Code for information inerchange

   美国最初采用的二进制和字符的编码映射表

2 Gb2312, Gbk1.0, Gbk10830

   中国最开始制定的编码表Gb2312,只包含简体字,后发现繁体字没有加进去,不断扩充,而出现了Gbk系列编码

3 unicode, utf-8

   由于世界各国都制定本国的编码表,导致各国之间信息交流出现障碍,遂ISO组织出面制定全球统一的编码表,即unicode码,又称万国码。

   万国码虽然包括了世界各国所有的字符,但是每个字符都用两个字节表示,对于英语国家来说,造成了大量的空间浪费,为了节省成本,对万国码进行压缩,字母用1个字节表示,欧洲字符用两个字节表示,中国汉字用三个字节表示

4 进入中国的操作系统采用中国制定的Gb2312编码标准,而Unix和Linux皆采用的utf-8的编码标准

 

Python学习----字符集编码

标签:utf-8   unicode   操作   进制   ascii   用两个   之间   编码   没有   

原文地址:https://www.cnblogs.com/tonytang271828/p/9498198.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!