码迷,mamicode.com
首页 > 编程语言 > 详细

python中的字符串编码问题——3.各操作系统下的不同编码方式

时间:2018-09-30 19:57:21      阅读:150      评论:0      收藏:0      [点我收藏+]

标签:root   byte   unicode   系统   查看   most   lan   字符串   oca   

各操作系统下的不同编码方式
 
先看一下
linux,python2.7
>>> B = b‘\xc3\x84\xc3\xa8‘
>>> B.decode(‘utf-8‘)
u‘\xc4\xe8‘
>>> type(B)
<type ‘str‘>
>>>  
 
windows,python2.7,python shell
>>> B = b‘\xc3\x84\xc3\xa8‘
>>> B.decode(‘utf-8‘)
u‘\xc4\xe8‘
>>> print B.decode(‘utf-8‘)

>>>
 
windows,python2.7,python cmd控制台
>>> B = b‘\xc3\x84\xc3\xa8‘
>>> B.decode(‘utf-8‘)
u‘\xc4\xe8‘
>>> print B.decode(‘utf-8‘)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
UnicodeEncodeError: ‘gbk‘ codec can‘t encode character u‘\xc4‘ in position 0: il
legal multibyte sequence
>>>
 
三种环境下不同输出的原因:
 
windows控制台默认采用GBK编码,liunx默认采用UTF-8编码
------------------------------------------------------
查看linux默认编码:
[root@localhost ~]# env |grep LANG
LANG=zh_CN.UTF-8
------------------------------------------------------
查看windows控制台默认编码:
cmd打开控制台---->属性---->查看编码为936(简体中文GBK)
(进一步在linux和windows下新建文本文件查看编码方式果然没错,证实。)

python中的字符串编码问题——3.各操作系统下的不同编码方式

标签:root   byte   unicode   系统   查看   most   lan   字符串   oca   

原文地址:https://www.cnblogs.com/Micang/p/9733028.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!