码迷,mamicode.com
首页 > 其他好文 > 详细

字符的编码

时间:2020-05-05 23:42:14      阅读:88      评论:0      收藏:0      [点我收藏+]

标签:表示   区分   编码方式   http   图片   nic   解析   png   统一   

技术图片

 

技术图片8位编码表示一个字符

 

技术图片欧洲人使用电脑后,扩展了字符集

 

技术图片16位能表示的汉字就多了

 

 技术图片

 

 技术图片

 

 技术图片

 

 技术图片

 

 技术图片为什么高8位和低8位要加A0(160),因为这样保证了高8位和低8位都>127,这样计算机就能区分GB2313码和ASCII码了,这样在解码的时候遇到连续两个>127的8位,就会解析成一个汉字

 

 技术图片

 

 技术图片由于6763个汉字不够用,后来又引入GBK字符集,只要求高位大于127,计算机遇到一个>127的8位,就意味着一个汉字的开始

 

 技术图片别的国家一看,说卧槽,凭什么中国有自己的字符集和编码方式,老子也要有自己的一套编码,但是这会出现乱码的问题,这时一个叫ISO的组织看不下去了,想要统一大家,于是提出了一个标准Unicode(包含了字符集和编码方式)

 

技术图片用32位表示一个UCS-4字符,太占存储空间了

 

技术图片

 

 技术图片90%的网站使用utf-8编码

 

总结

确定字符集->标注码位->码位转为2或16进制

 

 

字符的编码

标签:表示   区分   编码方式   http   图片   nic   解析   png   统一   

原文地址:https://www.cnblogs.com/t1314/p/12833466.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!