标签:参考 blog sci 理解 平面 utf-16 资料 关系 字符
个人理解,细节不是很多,参考资料说的更好,今天突然看到这块东西,对这个Unicode编码以及Unicode和UTF-8等之间的关系理解更深了。这里主要涉及码点这个概念,即哪个数字对应哪个字符,然后Unicode解决的就是这个问题,但是具体的如何在计算机中用字节去表示这些码点(即编码的概念),则产生出了UTF-32(4个字节表示),UTF-16(只能是2个或4个字节),UTF-8(可以是1,2,3,4个字节)这些编码方式。
然后这里再提一个,JS的编码由于历史原因内部使用的是ucs-2,可以认为是UTF-16的一个子集(只支持2个字节的基本平面字符),所以遇到辅助平面的字符的时候会拆分成2个基本平面编码(UTF-16的),但是对于字符的正确识别这一块已经改善很多。
参考网址:
http://www.ruanyifeng.com/blog/2014/12/unicode.html
http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html
标签:参考 blog sci 理解 平面 utf-16 资料 关系 字符
原文地址:https://www.cnblogs.com/marshwinter/p/13362531.html