编码方式

时间：2017-04-02 19:16:09 阅读：164 评论：0 收藏：0 [点我收藏+]

一

1.unicode只是一种编码方式。

ASCII码：127个数字：对应7个比特位————> 美国——占1个字节

扩展ASCII码：256个数字：8个比特位——————>拉丁——占1个字节

中文扩展ASCII码（GB2312）：几千个状态————>中国——占2个字节

中文扩展ASCII码（GBK）：两万多个状态—————中国---占1个字节

Unicode（万国码）：———六七万个字节———全世界----都是2个字节

UTF8（美国人伤不起，在万国码基础上改进成能伸能缩的编码方式）：

　　英文1个字节，非英文考虑两个或三个，中国变成3个字节了！坑！

2.编码与解码。

我们向软件输入文字并保存的过程（编码过程）：

其实是软件先将你的明文字符扔到内存，它是以unicode编码方式转成二进制扔到内存里的，而后不能以utf8编码方式的二进制写到硬盘上（因为utf8占空间），它在内存里再把unicode编码的二进制转成utf8编码方式的二进制数。

unico是：明文——>unico二进制——>utf8二进制——>磁盘

我们从硬盘里打开保存的文件（解码过程）：

utf8它不能直接将二进制转化成明文，所以：

utf8二进制——>unicode二进制——>内存——>明文

编码方式

原文地址：http://www.cnblogs.com/mrpengfei/p/6659588.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

周排行