码迷,mamicode.com
首页 > 其他好文 > 详细

3 -11 字符编码与转换

时间:2018-03-11 21:00:24      阅读:146      评论:0      收藏:0      [点我收藏+]

标签:sys   img   bsp   encode   encoding   import   strong   asc   png   

中文的字符编码  是 gbk   windows 默认的字符编码也是gbk

每个国家都有自己的字符编码 为了 统一 就有了

unicode

##unicode 不管英文中文都占 2个字节  16位

ascii码 一个英文一个字节  不能存中文。。 8 位 英文 或特殊字符

转换后 中文 变成3个字节

其中utf-8 是  Unicode的 可变长度的扩展级

技术分享图片

 encode 是编码    decode  是 解码   

 

import sys
print(sys.getdefaultencoding())
### 查看系统编码是 什么

 

 

技术分享图片

 

utf-8 转换成  gbk

1,首先你要去Unicode 里告诉 它  我是 utf-8    decode()解压

2  然后再编码成 gbk 格式 显示

gbk 转换 utf-8

1,首先去unicode 里告诉自己是 gbk       decode(‘gbk‘)

2 , 然后再编码成 utf-8  展现       encode(‘utf-8‘)

以上 Python2.x   操作。

 

3 -11 字符编码与转换

标签:sys   img   bsp   encode   encoding   import   strong   asc   png   

原文地址:https://www.cnblogs.com/th-lyc/p/8545366.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!