码迷,mamicode.com
首页 > 其他好文 > 详细

编码和字符串

时间:2018-01-14 18:39:50      阅读:146      评论:0      收藏:0      [点我收藏+]

标签:for   you   encode   自动   post   添加   sci   blog   int   

(1)编码
ASCII码,一共有127个字符,中国制定了GB2312编码,把中文编进去;
Unicode把所有语言统一到一套编码里,ASCII码是1个字节,而Unicode通常是2个字节;
UTF-8编码,把Unicode编码转化为“可变长编码”;
在计算机内存中,统一使用Unicode编码,当需要保存到硬盘或者需要传输的时候,就转换为UTF-8编码;
浏览网页的时候,服务器会把动态生成的Unicode内容转换为UTF-8再传输到浏览器;
为了避免乱码问题,应坚持始终使用UTF-8编码;在文件头部添加 # _*_ coding:utf-8 _*_
Python会忽略这句代码,但是它却可以作为“黑客”或者解决问题的方法来制定文件的格式。

(2)字符串
python的字符串类型:str,在内存中以Unicode表示,strVar=‘ABC‘,bStrVar=strVar.encode(‘utf-8‘)
在网络传输或保存磁盘的时候,把str变为以字节为单位的bytes,bytesVar=b‘ABC‘,strBytesVar=bytesVar.decode(‘utf-8‘)
str的len()计算的是字符数,bytes的len()计算的是字节数;

格式化输出
‘Hi,%s,you have $%d.‘ %(‘xyl‘,10000) # ‘Hi,xyl,you have $10000.‘
‘Hi,{0},you have ${1}.‘.format(‘xyl‘,10000) # ‘Hi,xyl,you have $10000.‘
"Hi,%s,i said %r." %(‘xyl‘,‘are you ok?‘) # "Hi,xyl,i said ‘are you ok?‘ "
%r给字符串加了单引号;%r打印时能够重现它所代表的对象
d=datetime.date.today()
print("%r" %d) #datetime.date(2018, 1, 14)

输入:python2:raw_input()
python3:input()

python -m pydoc -b # 回去自动启动一个web server,同事启动浏览器展示帮助系统
-m:查看module在当前的可见的搜索路径上
-b:启动的是浏览器
python -m pydoc input # 查看input的说明

编码和字符串

标签:for   you   encode   自动   post   添加   sci   blog   int   

原文地址:https://www.cnblogs.com/xyl-share-happy/p/8283713.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!