标签:表示 世界 encode 出现 bsp sci 繁体中文 ansi info
decoder:解码--> 将文件内容转换为字符对象;
encoder:编码-->将字符对象转换为字节或者字节数组;
ASCII (American Standard for Information Tnterchange ) 使用7 bit 表示一个字符,共计表示128字符
ISO-8859-1 :八bit 表示一个字符 ,即用一个字节表示一个字符 ,表示256个字符
gb2312: 中华人民共和国制定, 两个字节表示一个汉字,没有考虑生僻字,表示汉字不全(中国制定)
gbk : gb2312 扩展,表示汉字数量超过gb2312(中国制定)
gb18030 :对gbk 扩展;(中国制定)
big5 :繁体中文
unicode :表示全世界的所有字符,统一的采用两个字节表示一个字符; 问题出现:存储容量问题出现,原来一个字节表示的字符,现在用两个,容量堪忧
UTF(unicode Transiation Format 即unicode 转换格式),是一种存储格式
unicode 是一个编码方式,而UTF 是存储方式,UTF-8 是unicode的实现方式之一
UTF-8 :变长的字节表示形式,意思就是,一个英文我就占用1个字节,汉字就三个字节方式存储
标签:表示 世界 encode 出现 bsp sci 繁体中文 ansi info
原文地址:https://www.cnblogs.com/iscys/p/9689676.html