标签:
在python的源代码文件中,允许使用不同的字符集编码而并非只是ASCII。最好的设置方法是在“#!”之后再多设置一个特殊的行,用来定义源代码文件的编码,就像下面这样:
# -*- coding: encoding -*-
通过上诉方式的定义,所有在源代码文件中的字符将都会被看做是(treated as)指定的编码方式去编码,同时该源文件就允许立即被写入选中的编码的Unicode字符字面量。Python所允许的编码方式,你可以在Python的库参考中找到,在 codecs 这一章节中。
举个例子,为了在文件中可以使用包含“Euro currency symbol”(欧元货币符号)的Unicode字面量(literals),那么就可以使用 ISO-8859-15 编码方式,“Euro symbol”(欧元符号)的顺序值是 164。下面这个脚本的作用将会打印出8364这个值(“Euro symbol”对应的(corresponding)Unicode字符序号(codepoint)),然后退出:
# -*- coding: iso-8859-15 -*- currency = u"€" print ord(currency)
如果你的编辑器支持将文件存储成 UTF-8 编码格式,同时带有 UTF-8 的顺序标记(order mark)(或者称做:BOM头),那么你就可以使用这种方式来代替编码方式定义的方式。
-----------待续。。。。
The Interpreter and ... 之 Source Code Encoding
标签:
原文地址:http://my.oschina.net/u/1156660/blog/382294