标签:中文 字符编码 gbk -- 字符集 种类 通用 英文 日文
-- 字符相关了解
字符:独立的文字就是一个字符,无论是什么语言
存储单位:
Byte字节
bit:位
1B = 8b
B:字节,1Byte = 8bit
KB: 1KB = 1024B
MB: 1MB = 1024KB
GB: 1GB = 1024MB
TB: 1TB = 1024GB
PB: 1PB = 1024TB
字符大小:
无论何种字符集:英文和数字都是个一个字节,汉字,韩文,日文等亚洲文字采用多个字节存储
GB系列编码:存储一个汉字使用2个字节 (国标编码:例如: gbk2312 )
UTF系列编码:存储一个汉字使用3个字节(国际通用:例如: utf-8 )
#字符编码种类:
英文原始编码:
ASCII码 -> 最早的字符编码格式->仅支持英文和特定的符号
中文编码:
GB2312 : 包含5000个常用汉字的标准
GB18030: 升级版本的标准,大概15000个汉字
GBK : 包含所有中文汉字的编码(推荐)
BIG5 : 繁体中文编码
混合编码/统一编码:
UTF-8:开发使用,同时支持几乎全部的字符
UTF-16:系统使用,同时支持几乎全部的字符
标签:中文 字符编码 gbk -- 字符集 种类 通用 英文 日文
原文地址:https://www.cnblogs.com/bling-bling-star/p/9392078.html