早期. 计算机是美国发明的. 普及率不?, ?般只是在美国使?. 所以. 最早的编码结构就是按照美国?的习惯来编码
的. 对应数字+字?+特殊字符?共也没多少. 所以就形成了最早的编码ASCII码. 直到今天ASCII依然深深的影响着我们.
随着计算机的发展. 以及普及率的提?. 流?到欧洲和亚洲. 这时ASCII码就不合适了. ?如: 中?汉字有?万个. ?ASCII
最多也就256个位置. 所以ASCII不?了. 怎么办呢? 这时, 不同的国家就提出了不同的编码?来适?于各?的语?环境.
?如, 中国的GBK, GB2312, BIG5, ISO-8859-1等等. 这时各个国家都可以使?计算机了.
GBK, 国标码占?2个字节. 对应ASCII码 GBK直接兼容. 因为计算机底层是?英?写的. 你不?持英?肯定不?. ?英
?已经使?了ASCII码. 所以GBK要兼容ASCII.
这?GBK国标码. 前?的ASCII码部分. 由于使?两个字节. 所以对于ASCII码??. 前9位都是0
国标码的弊端: 只能中国?. ?本就垮了. 所以国标码不满?我们的使?. 这时提出了?个万国码Unicode. unicode?
开始设计是每个字符两个字节. 设计完了. 发现我?中国汉字依然?法进?编码. 只能进?扩充. 扩充成32位也就是4个字
节. 这回够了. 但是. 问题来了. 中国字9万多. ?unicode可以表?40多亿. 根本?不了. 太浪费了. 于是乎, 就提出了新的
UTF编码.可变?度编码
UTF-8: 每个字符最少占8位. 每个字符占?的字节数不定.根据?字内容进?具体编码. 比如. 英?. 就?个字节就够了. 汉
字占3个字节. 这时即满?了中?. 也满?了节约. 也是?前使?频率最?的?种编码
UTF-16: 每个字符最少占16位.
GBK: 每个字符占2个字节, 16位.
单位转换:
8bit = 1byte
1024byte = 1KB
1024KB = 1MB
1024MB = 1GB
1024GB = 1TB
1024TB = 1PB
1024TB = 1EB
1024EB = 1ZB
1024ZB = 1YB
1024YB = 1NB
1024NB = 1DB
常?到TB就够了