JAVA基础---编码解码

时间：2017-06-29 09:53:28 阅读：117 评论：0 收藏：0 [点我收藏+]

所谓编码即char->byte

所谓解码即byte->char

ISO-8859-1 中文字符会被黑洞吸收全部变为"?"

技术分享

GB2312 汉字可以被编码为双字节但是该标准仅仅支持6763个汉字且char到byte需要查表

技术分享

GBK 与GB2312基本相同只不过包含更多的汉字

技术分享

UTF-16 将char强行拆成两个字节不存在的部分写00 规则简单编码效率高缺点浪费了部分存储空间且一个汉字拆为三个字节

其中一个字符码损坏后面会受影响适合在本地磁盘和内存之间使用不适合网络传输（易损坏字节流 数据经过网络传输时都是以字节为单位的）

技术分享

UTF-8 对单字节范围内的字符仍然使用1个字节表示，对汉字则采用3个字节表示更适合在网络传输且UTF-8在编码效率上和编

码安全性上做了平衡，是理想的中文编码方式

技术分享

UTF-16 UTF-8都是处理Unicode编码

当采用压缩算法对字符进行压缩时候，不能仅仅看字符数量的减少（这是没意义的），而要重点关注最终的字节数，这还取决于选择的编码方式。

原文地址：http://www.cnblogs.com/luyu1993/p/7092544.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

周排行