码迷,mamicode.com
首页 > 其他好文 > 详细

彻底搞清楚字符编码: ASCII, ISO_8859, GB2312,UCS, Unicode, Utf-8

时间:2016-09-20 11:44:20      阅读:119      评论:0      收藏:0      [点我收藏+]

标签:

彻底搞清楚字符编码: ASCII, ISO_8859, GB2312,UCS, Unicode, U

 

 

1、ASCII: 0-127(128-255未使用),美国标准

2、IS0-8859-1(latin-1): 0-255, 西欧国家等

3、GB2312:常用简体中文,双字节编码,国标,对于ASCII字符仍采用单字节编码

4、GBK: GB2312的超集,包含繁体,日韩,双字节编码,不是国标(新的国标GB18030-2000是GBK的超集)

5、BIG5:繁体中文,台湾,类似GB2312

6、SJIS: 日本,类似GB2312

7、ISO10646(UCS): 31位字符集,目前仅使用0x0000-0xFFFD,即使对于ASCII字符,也以16bit为单位存储

8、Unicode: 与ISO10646互相兼容,独立发展(两者均有缺陷,对于编程来说,一些单字节的特殊字符,如‘\0‘等无法读取)

9、utf-8: 解决unicode编码中的缺陷,变字节编码,最多6字节,(ascii字符使用1Byte,中文3Byte)

彻底搞清楚字符编码: ASCII, ISO_8859, GB2312,UCS, Unicode, Utf-8

标签:

原文地址:http://www.cnblogs.com/jingzhishen/p/5887936.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!