是一种编码表格,例如,给一个汉字规定一个代码。类似 GB2312-1980, GB18030等,只不过字集不同。 一个可能转成长度为一个BYTE,或两个,三个,四个BYTE的UTF8码,取决于unicode码的值。英文unicode码因为值小于0x80,只要用一个BYTE的UTF8传送,比送unicode两个BYTEs快。 UTF8是为传送unicode而想出来的“再编码”方法罢了。 UTF8转unicode用我上面给的程序反算即可。
原文地址:http://my.oschina.net/u/554046/blog/292729