码迷,mamicode.com
首页 > 编程语言 > 详细

java 字符深入知识,待整理

时间:2017-04-07 16:58:25      阅读:182      评论:0      收藏:0      [点我收藏+]

标签:unit   兼容   tran   接受   cte   shu   logs   poi   数组   

‘编‘,"编",  为什么获取到的字节数组长度不一样

http://www.cnblogs.com/yongdaimi/p/5899328.html

Unicode 官网

http://unicode.org/

utf-8 汉字对照表

http://blog.chinaunix.net/uid-25544300-id-3281847.html

提及内码与外码

https://www.zhihu.com/question/27562173

code unit 和 code point

http://www.jianshu.com/p/a7db6ac53d57

编码问题,写的很细,但是目前看不懂

http://www.fmddlmyy.cn/text6.html

 

 

Unicoce码又称为UCS

Unicode的学名是"Universal Multiple-Octet Coded Character Set",简称为UCS。UCS可以看作是"Unicode Character Set"的缩写。

 

 

 

UCS只是规定如何编码,并没有规定如何传输、保存这个编码。例如“汉”字的UCS编码是6C49,我可以用4个ascii数字来传输、保存这个编码;也可以用utf-8编码:3个连续的字节E6 B1 89来表示它。关键在于通信双方都要认可。UTF-8、UTF-7、UTF-16都是被广泛接受的方案。UTF-8的一个特别的好处是它与ISO-8859-1完全兼容。UTF是“UCS Transformation Format”的缩写。

java 字符深入知识,待整理

标签:unit   兼容   tran   接受   cte   shu   logs   poi   数组   

原文地址:http://www.cnblogs.com/mrxiaohe/p/6678603.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!