码迷,mamicode.com
首页 > 编程语言 > 详细

python 字符串和编码

时间:2017-06-03 20:52:56      阅读:145      评论:0      收藏:0      [点我收藏+]

标签:unicode   数字   ascii码   pytho   code   特殊字符   占用   asc   了解   

ASCII编码:

计算机是美国人发明的,所以字符串只有数字,英文字母和特殊字符,一共有127个字符被编码在计算机里,这个编码表被称为ASCII编码。这种编码存储字符只用了一个byte即8bit.

Unicode(万国码,统一编码):

但要存储全世界的字符1byte是绝对不够的。这时unicode编码应运而生,最常用的是用2byte表示一个字符.

UTF-8编码:

使用Unicode虽然解决了乱码问题,但是如果文本都是英文,这样存储太浪费空间且传输时也很浪费带宽。所以为了解决这个问题UTF-8编码应运而生。这种方式是把Unicode编码转换成UTF-8编码。英文占用1byte,汉字占用3byte,很生僻的字才用4-6byte. 实际上ASCII码可以看作UTF-8的一部分。

python 字符串和编码

标签:unicode   数字   ascii码   pytho   code   特殊字符   占用   asc   了解   

原文地址:http://www.cnblogs.com/Dev-Ops/p/6938311.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!