标签:style sp 数据 on amp size 应用 网络 字符串
位和字节
我们都知道计算机存储的东西是二进制,究其根本它只能存储101010101010这种序列,每一个数字就是一位(bit),每8位是一个字节(Byte),位是计算机传输的最小单位,而字节是编码的最小单位 。
字符
再说字符,字符是我们看到的汉字或英文,比如 “你”,"a" “@”等等 ,可以理解为我们最后看到的每一个文字都是一个字符,不同的编码对应同样字符所需的字节数也是不同的,继续说下编码
编码
编码就是字节到字符的规则,举个例子 你可以用0001 代表1这个字符,也可以用01 代表1这个字符,这就需要规则
具体规则就不细说了,应用对的场景可以节省带宽资源
解码
既然有编码就有解码,数据在网络中是二进制形式传输的,可以看做是发送情报,a发送情报给b,如果b的解密和a的加密不是配套的b就读不出a传递的信息,编码解码就是这个道理。
丢失信息
看官肯定想反正是二进制,解码后乱码那我就继续解码直到解为不是乱码为止。但是如果不小心就会信息丢失,举个例子ISO8859-1解码中文编码的数据,8859-1不认识中文,每遇到一个中文字符它就把它变成一个?如果我们拿着8859-1解码后的数据恢复成中文编码,那么中文的部分都被替换成了?这就出现了丢失信息,怎么办呢,获取到的字符串做个保存,不要直接拿去解码就不会丢失信息了
最后总结一下,位和字节都是单位,字符是看到的结果,解码编码则是固定的规则
标签:style sp 数据 on amp size 应用 网络 字符串
原文地址:http://blog.csdn.net/zsx0321/article/details/41151881