标签:文字 分享 windows src 解码 字符编码 1.0 多个 二进制
计算机最底层能识别的
二进制数:0,1
为将二进制数转变成人能看懂的文字
中国
发展出 ------>ASCII:只能存英文和拉丁字符。 一个字符占一个字节,八位
------>gb2312 :只能存6700多个中文, 1980
------>gbk1.0:存了2万多字符, 1995
------>gb18030:存了2万7千个中文, 2000
国际
----------------------------->unicode(相当于一个标准):utf-32(unicode的一个表现形式,编码集): 一个任意字符占4个字节
------>unicode:utf-16: 一个字符占2个字节或2个以上(如果找不到字符对应的编码就在utf-32中去找)
------>unicode-8: 一个英文用ASCII码来存,一个中文占3个字节
中国标准用的是gbk
windows系统用的是gb18030
编码和解码
标签:文字 分享 windows src 解码 字符编码 1.0 多个 二进制
原文地址:http://www.cnblogs.com/air3162/p/7684859.html