标签:技术 python 检验 src mic 哪些 cmap map 进一步
一日一技:如何判断某个汉字是不是在字体库中摄影:产品经理
下厨:kingname
我们喜欢从网上下载各种各样的中文字体,但这些字体一般只设计了常用汉字,遇到生僻字时就会变成系统默认字体。如下图所示为方正静蕾简体,没有“龍鑨”两个汉字:
现在,我手上有10000个汉字,我如何快速确定哪些汉字在这个字体库中呢?
为了解决这个问题,我们需要安装 Python 的一个第三方库:fontTools
首先我们来安装它:
python3 -m pip install fonttools
然后,我们编写代码,读取字体库中的所有字体:
from fontTools.ttLib import TTFont
font = TTFont(‘方正静蕾体.ttf‘)
unicode_map = font[‘cmap‘].tables[0].ttFont.getBestCmap()
这段代码获取的 unicode_map是一个字典,字典的 key 是这个字体库中所有字符的 unicode 码。所以,如果我们要检查某个汉字在不在这个字体库中,只需要检查汉字的 unicode 码在不在unicode_map中即可:
words = ‘一二龍三四‘
for word in words:
if ord(word) in unicode_map:
print(f‘字体库中有:【{word}】这个汉字‘)
else:
print(f‘字体库没有:【{word}】这个汉字‘)
运行效果如下图所示:
对于守规矩的字体,这样写就足够了。但是有一些字体,他们明明没有某个汉字,却非要把这个汉字的 unicode 码添加到 unicode_map中,所以我们还可以再进一步检验:
glyf_map = font[‘glyf‘]
if len(glyf_map[unicode_map[ord(word)]].getCoordinates(0)[0]) == 0:
print(f‘字符:【{word}】确实不在字体库中‘)
完整的代码如下图所示:
from fontTools.ttLib import TTFont
font = TTFont(‘方正静蕾体.ttf‘)
unicode_map = font[‘cmap‘].tables[0].ttFont.getBestCmap()
glyf_map = font[‘glyf‘]
words = ‘一二龍三四‘
for word in words:
if ord(word) in unicode_map and len(glyf_map[unicode_map[ord(word)]].getCoordinates(0)[0]) > 0:
print(f‘字体库中有:【{word}】这个汉字‘)
continue
print(f‘字体库没有:【{word}】这个汉字‘)
标签:技术 python 检验 src mic 哪些 cmap map 进一步
原文地址:https://blog.51cto.com/15023263/2558847