标签:
GBK编码:汉字占两个字节
UTF-8编码: 通常汉字占三个字节, 扩展B区以后的汉字占四个字节
UTF-16编码: 通常汉字占两个字节,CJKV扩展B区、扩展C区、扩展D区中的汉字占四个字节(一般字符的Unicode范围是U+0000至U+FFFF,而这些扩展部分的范围大于U+20000,因而要用两个UTF-16)
各种编码中汉字所占字节数
原文地址:http://www.cnblogs.com/everest33Tong/p/5727470.html