码迷,mamicode.com
首页 > 其他好文 > 详细

一日一技:如何判断某个汉字是不是在字体库中

时间:2020-12-08 12:06:08      阅读:4      评论:0      收藏:0      [点我收藏+]

标签:技术   python   检验   src   mic   哪些   cmap   map   进一步   

一日一技:如何判断某个汉字是不是在字体库中

技术图片

摄影:产品经理
下厨:kingname
我们喜欢从网上下载各种各样的中文字体,但这些字体一般只设计了常用汉字,遇到生僻字时就会变成系统默认字体。如下图所示为方正静蕾简体,没有“龍鑨”两个汉字:
技术图片

现在,我手上有10000个汉字,我如何快速确定哪些汉字在这个字体库中呢?

为了解决这个问题,我们需要安装 Python 的一个第三方库:fontTools

首先我们来安装它:


python3 -m pip install fonttools

然后,我们编写代码,读取字体库中的所有字体:


from fontTools.ttLib import TTFont

font = TTFont(‘方正静蕾体.ttf‘)
unicode_map = font[‘cmap‘].tables[0].ttFont.getBestCmap()

这段代码获取的 unicode_map是一个字典,字典的 key 是这个字体库中所有字符的 unicode 码。所以,如果我们要检查某个汉字在不在这个字体库中,只需要检查汉字的 unicode 码在不在unicode_map中即可:


words = ‘一二龍三四‘
for word in words:
    if ord(word) in unicode_map:
        print(f‘字体库中有:【{word}】这个汉字‘)
    else:
        print(f‘字体库没有:【{word}】这个汉字‘)

运行效果如下图所示:
技术图片

对于守规矩的字体,这样写就足够了。但是有一些字体,他们明明没有某个汉字,却非要把这个汉字的 unicode 码添加到 unicode_map中,所以我们还可以再进一步检验:


glyf_map = font[‘glyf‘]
if len(glyf_map[unicode_map[ord(word)]].getCoordinates(0)[0]) == 0:
            print(f‘字符:【{word}】确实不在字体库中‘)

完整的代码如下图所示:


from fontTools.ttLib import TTFont

font = TTFont(‘方正静蕾体.ttf‘)
unicode_map = font[‘cmap‘].tables[0].ttFont.getBestCmap()
glyf_map = font[‘glyf‘]
words = ‘一二龍三四‘
for word in words:
    if ord(word) in unicode_map and len(glyf_map[unicode_map[ord(word)]].getCoordinates(0)[0]) > 0:
        print(f‘字体库中有:【{word}】这个汉字‘)
        continue
    print(f‘字体库没有:【{word}】这个汉字‘)

技术图片

一日一技:如何判断某个汉字是不是在字体库中

标签:技术   python   检验   src   mic   哪些   cmap   map   进一步   

原文地址:https://blog.51cto.com/15023263/2558847

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!