码迷,mamicode.com
首页 > 其他好文 > 详细

字符编码的演化

时间:2018-02-07 22:48:23      阅读:199      评论:0      收藏:0      [点我收藏+]

标签:问题   big   linu   字符编码   1.0   iso   class   post   表示   

  • GB2312又称国标码,由国家标准总局发布,1981年5月1日实施,通行于大陆。新加坡等地也使用此编码。共7445个图形字符,其中汉字占6763个。
  • 1995年发布GBK1.0,gbk编码能够用来同时表示繁体字和简体字,该编码标准兼容GB2312,共收录汉字21003个,同时包含中日韩文字里的所有汉字。
  • 2000年发布GB18030,是对GBK编码的扩充,覆盖中文、日文、朝鲜语和中国少数民族文字,其中收录27484个汉字。兼容GBK和GB2312字符集。
  • BIG5编码:台湾地区繁体中文标准字符集,采用双字节编码,共收录13053个中文字,1984年实施。

为解决每个国家不同编码间不互通的问题,ISO标准组织出马了!

Unicode编码:国际标准字符集,它将世界各种语言的每个字符定义一个唯一的编码,以满足跨语言、跨平台的文本信息转换。Unicode(统一码、万国码)规定所有的字符和符号最少由16位来表示(2个字节)。2**16=65536

UTF-8,是对Unicode编码的压缩和优化,他不再使用最少使用2个字节,而是将所有的字符和符号进行分类:ascii码中的内容用1个字节保存、欧洲的字符用2个字节保存,东亚的字符用3个字节保存……

 

windows系统中文版默认编码是GBK

Mac OS\Linux系统默认编码是UTF-8

字符编码的演化

标签:问题   big   linu   字符编码   1.0   iso   class   post   表示   

原文地址:https://www.cnblogs.com/echo-kid-coding/p/8428461.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!