码迷,mamicode.com
首页 > 编程语言 > 详细

用python输出汉字字库

时间:2014-07-20 10:46:08      阅读:732      评论:0      收藏:0      [点我收藏+]

标签:字库   编码   codec   

问题1:假设我们知道汉字编码范围是0x4E00到0x9FA5,怎么从十六进制的编码转成人类可读的字呢?

问题2:怎么把unicode编码的字写入文件呢,如果直接用open()的话,会提示UnicodeEncodeError: ‘ascii‘ codec can‘t encode character u‘\u4e00‘ in position 0: ordinal not in range(128)


问题1的答案是用unichr,问题2的答案是用codes。

下面上代码。

import codecs
start,end = (0x4E00, 0x9FA5)
with codecs.open("chinese.txt", "wb", encoding="utf-8") as f:
    for codepoint in range(int(start),int(end)):
        f.write(unichr(codepoint))


打开chinese.txt文件,截图如下
bubuko.com,布布扣

用python输出汉字字库

标签:字库   编码   codec   

原文地址:http://blog.csdn.net/handsomekang/article/details/37989215

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!