码迷,mamicode.com
首页 > 编程语言 > 详细

四.python3 字符编码

时间:2017-10-18 10:01:28      阅读:268      评论:0      收藏:0      [点我收藏+]

标签:文字   分享   windows   src   解码   字符编码   1.0   多个   二进制   

计算机最底层能识别的

二进制数:0,1

为将二进制数转变成人能看懂的文字

中国

发展出 ------>ASCII:只能存英文和拉丁字符。 一个字符占一个字节,八位

               ------>gb2312 :只能存6700多个中文, 1980

                   ------>gbk1.0:存了2万多字符,   1995

                      ------>gb18030:存了2万7千个中文,   2000

 

国际

----------------------------->unicode(相当于一个标准):utf-32(unicode的一个表现形式,编码集): 一个任意字符占4个字节

                                ------>unicode:utf-16: 一个字符占2个字节或2个以上(如果找不到字符对应的编码就在utf-32中去找)

                                   ------>unicode-8: 一个英文用ASCII码来存,一个中文占3个字节

中国标准用的是gbk

windows系统用的是gb18030

编码和解码

技术分享 

 

四.python3 字符编码

标签:文字   分享   windows   src   解码   字符编码   1.0   多个   二进制   

原文地址:http://www.cnblogs.com/air3162/p/7684859.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!