码迷,mamicode.com
首页 > 其他好文 > 详细

关于Unicode的小理解

时间:2020-07-22 20:47:17      阅读:63      评论:0      收藏:0      [点我收藏+]

标签:参考   blog   sci   理解   平面   utf-16   资料   关系   字符   

个人理解,细节不是很多,参考资料说的更好,今天突然看到这块东西,对这个Unicode编码以及Unicode和UTF-8等之间的关系理解更深了。这里主要涉及码点这个概念,即哪个数字对应哪个字符,然后Unicode解决的就是这个问题,但是具体的如何在计算机中用字节去表示这些码点(即编码的概念),则产生出了UTF-32(4个字节表示),UTF-16(只能是2个或4个字节),UTF-8(可以是1,2,3,4个字节)这些编码方式。

然后这里再提一个,JS的编码由于历史原因内部使用的是ucs-2,可以认为是UTF-16的一个子集(只支持2个字节的基本平面字符),所以遇到辅助平面的字符的时候会拆分成2个基本平面编码(UTF-16的),但是对于字符的正确识别这一块已经改善很多。

参考网址:

http://www.ruanyifeng.com/blog/2014/12/unicode.html

http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html

关于Unicode的小理解

标签:参考   blog   sci   理解   平面   utf-16   资料   关系   字符   

原文地址:https://www.cnblogs.com/marshwinter/p/13362531.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!