码迷,mamicode.com
首页 > 其他好文 > 详细

中文编码如何选择?

时间:2020-04-18 11:49:39      阅读:62      评论:0      收藏:0      [点我收藏+]

标签:dom   方法   line   表示   兼容性   最大   编码   国际   ascii   

1、收录汉字
GB2312:基本集共收入汉字6763个和非汉字图形字符682个。

GBK:共收录了21003个汉字。7a686964616fe78988e69d8331333431366265

GB18030:共收录汉字70244个。

2、兼容性

GB2312:基本满足了汉字的计算机处理需要,对于人名、古汉语等方面出现的罕用字,GB 2312不能处理。

GBK:GBK 向下与 GB 2312 编码兼容,向上支持 ISO 10646.1国际标准。

GB18030:对GB 2312-1980完全向后兼容,与GBK基本向后兼容,并支持Unicode(GB 13000)的所有码位。

3、发布时间

GB2312:由中国国家标准总局1980年发布,1981年5月1日开始实施。

GBK:1995年12月1日制订。

GB18030:初版于2000年3月17日发布,现行版本于2005年11月8日发布,2006年5月1日实施。

4、编码

GB2312:通常采用EUC储存方法,以便兼容于ASCII。每个汉字及符号以两个字节来表示。

GBK:GBK是采用单双字节变长编码,英文使用单字节编码,完全兼容ASCII字符编码,中文部分采用双字节编码。

GB18030 :GB18030包含三种长度的编码:单字节的ASCII、双字节的GBK(略带扩展)、以及用于填补所有Unicode码位的四字节UTF区块。


显而易见选择GB18030能最大程度的支持中文,包括繁体等。

中文编码如何选择?

标签:dom   方法   line   表示   兼容性   最大   编码   国际   ascii   

原文地址:https://www.cnblogs.com/hbuuid/p/12724711.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!