标签:
编码的发展史:
Unicode向utf-8转换的规则:
Unicode | utf-8 |
0000 - 007F | 0xxx xxxx |
0080 - 07FF | 110x xxxx 10xx xxxx |
0800 - FFFF | 1110 xxxx 10xx xxxx 10xx xxxx |
如上表举例,”汉“字的Unicode编码是6c49,在800-FFFF之间,写成二进制的话是:0110 1100 0100 1001. 将这16位二进制从左到右依次填入1110 xxxx 10xx xxxx 10xx xxxx 的x中, 得到: 1110-0110 10-11 0001 10-00 1001, 即E6 B1 89.
标签:
原文地址:http://www.cnblogs.com/haoshine/p/5076901.html