Unicode和ASCII码属于同一级别的,都是字符集,字符集规定从1到这个字符集的最大范围每个序号都各表示什么意思。比如ASCII字符集中序号65表示“A”。
那接下来的UTF8和UTF16就相当于我们在计算机中怎么表示这个序号了。这就好比,通常情况下我们用十进制表示数字(1表示一个,2表示两个)。但是有时候我们也会根据情况用二进制,八进制,十六进制表示。
UTF8编码规则表示一个序号可能用一个字节/两个字节/三个字节来表示。UTF16编码规则表示一个序号只会用两个字节表示。其他的编码规则例如GB2312/GBK也都类似。
最后,可以用一句话理解并记住他们的区别:把UTF8/UTF16/GB2312/GBK编码规则理解成一种进制,解析的时候把他们转换成十进制然后查询字符集表即可。
转载请注明出处。