码迷,mamicode.com
首页 > 编程语言 > 详细

Python编码_ASCII_Unicode_UTF-8

时间:2016-08-14 22:13:38      阅读:250      评论:0      收藏:0      [点我收藏+]

标签:

 

技术分享

 

获取一个字符的ASCII码值,使用内置函数 ord(),ASCII码占一个字节 ascii不能存中文

>>> # A 和 a 分别的对应的ASCII码值是
>>> ord(A)
65
>>> ord(a)
97
>>>

 Unicode占2个字节,它是可以存中文的,不管是英文还是中文均存储为2个字节

# Python3.5

>>> name = u范特西
>>> name
范特西
>>> type(name)
<class str>
>>> 
# Python2.7

>>> name = u范特西
>>> name
u\u8303\u7279\u897f
>>> type(name)
<type unicode>
>>>

Utf-8占3个字节, 如果是英文就占1个字节,如果是中文就占3个字节,utf-8是解决Unicode存储英文占容量大的问题

>>> name = name.encode(utf-8)
>>> len(name)
9
>>> name
b\xe8\x8c\x83\xe7\x89\xb9\xe8\xa5\xbf
>>> 

 

>>> name = u博尔特
>>> name = name.encode(utf-8)
>>> name
b\xe5\x8d\x9a\xe5\xb0\x94\xe7\x89\xb9
>>> name.decode(utf-8)
博尔特
>>> 

 

告诉Python以Utf-8的形式去解析你的代码,在*.py文件最上面一行加上  #_*_ coding:utf-8 _*_ 即可.

 

Python编码_ASCII_Unicode_UTF-8

标签:

原文地址:http://www.cnblogs.com/yangw/p/5770953.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!