码迷,mamicode.com
首页 > 其他好文 > 详细

字符编码+文件处理

时间:2018-09-19 16:24:40      阅读:148      评论:0      收藏:0      [点我收藏+]

标签:用两个   编码   特点   ascii码表   进制   文字   十六   nic   bsp   

1,什么是字符编码?

字符编码表:人类的字符<--------->数字

ASCII码表:只能识别英文字符

用八个二进制位表示一个英文字符,1个英文字符=8bit

2,为何用字符编码

因为计算机无法识别人类的字符,人类与计算机打交道都是用人类的字符,而计算机无法识别人类的字符只能识别二进制,所以必须为人类的字符编码成计算机能识别的二进制数字

 

GBK:能识别汉字与英文

1个汉字=2个字节(bytes)=16个bit

1个英文字符=一个字节8bit

一个字节即1bytes=8个二进制位=8bit

Unicode:能识别万国字符,一个字符用两个字节即十六个bit

特点:能识别万国语言

与各个国家的字符编码都有映射关系

utf-8:一个bytes表示英文,三个bytes表示一个汉字

utf-8是Unicode的转换格式

 

重点:

编码:字符---------->编码---------->unicode的二进制---------->编码---------->GBK的二进制

解码:GBK的二进制---------->解码---------->unicode的二进制---------->解码---------->字符

 

字符编码+文件处理

标签:用两个   编码   特点   ascii码表   进制   文字   十六   nic   bsp   

原文地址:https://www.cnblogs.com/zhangrenguo/p/9674635.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!