码迷,mamicode.com
首页 > 其他好文 > 详细

编码方式

时间:2017-04-02 19:16:09      阅读:164      评论:0      收藏:0      [点我收藏+]

标签:code   strong   ora   unicode   utf8   lin   line   输入   nic   

1.unicode只是一种编码方式。

 ASCII码:127个数字: 对应7个比特位————> 美国——占1个字  节

 扩展ASCII码:256个数字:8个比特位——————>拉丁——占1个字  节

 中文扩展ASCII码(GB2312): 几千个状态————>中国——占2个  字节

 中文扩展ASCII码(GBK):两万多个状态—————中国---占1个字  节

 Unicode(万国码):———六七万个字节———全世界----都是2个  字节

 UTF8(美国人伤不起,在万国码基础上改进成能伸能缩的编码方  式):

  英文1个字节,非英文考虑两个或三个,中国变成3个字节了!坑!

2.编码与解码。

我们向软件输入文字并保存的过程(编码过程):

其实是软件先将你的明文字符扔到内存,它是以unicode编码方式转成二进制扔到内存里的,而后不能以utf8编码方式的二进制写到硬盘上(因为utf8占空间),它在内存里再把unicode编码的二进制转成utf8编码方式的二进制数。

unico是:明文——>unico二进制——>utf8二进制——>磁盘

我们从硬盘里打开保存的文件(解码过程):

utf8它不能直接将二进制转化成明文,所以:

utf8二进制——>unicode二进制——>内存——>明文

 

编码方式

标签:code   strong   ora   unicode   utf8   lin   line   输入   nic   

原文地址:http://www.cnblogs.com/mrpengfei/p/6659588.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!