码迷,mamicode.com
首页 > 其他好文 > 详细

字符编码与二进制

时间:2017-06-28 21:57:27      阅读:175      评论:0      收藏:0      [点我收藏+]

标签:兼容   数字   使用   显示   utf-8   asc   进制   font   收录   

字符编码的由来:

计算机只认识0和1,因为计算机底层就是电路
二进制可以使用数字转换
二进制字符编码,可以使用数字来表示字符
ASCII码最多用8位来表示一个字节,英文使用了127个字符,预留128-255
128-255进行扩展 ,在扩展中加入了7000多个中文字符,1980年定义的就是GB2312
1995年收录了20000多个汉字,就是GBK
2000年使用了GB18030,收录了27000多字符,包含藏文,蒙文等
字符编码向下兼容

最常用的中文编码就是GBK

国际ISO标准组织就叫Unicode,就是万国码,不兼容GBK
UTF8就是Unicode,可变长的字符集,英文字符用UTF8存储就是ASCII码,用中文就是UTF8

ASCII 255 1Bytes
----->1980 GB2312 7xxx
------> 1995 GBK1.0 2W+
------> 2000 GB10830 27xxx
------>unicode 2bytes
------> UTF-8 en:1bytes,zh:3bytes

Python2里显示中文需要申明编码:
# -*- coding:utf-8 -*-

Python3默认就是utf8,可以直接打印输出

字符编码与二进制

标签:兼容   数字   使用   显示   utf-8   asc   进制   font   收录   

原文地址:http://www.cnblogs.com/roberto9/p/7091514.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!