标签:https 实例 搜索 href 切分 解码 www 如何 提升
本文简单地介绍了KWS的原理——为Lattice中每个词生成索引并进行搜索;介绍了如何处理OOV——替补(Proxy,词典内对OOV的替补)关键词技术;介绍了KWS的语料库格式;介绍了KWS在Kaldi中的示例训练脚本和搜索脚本。
论文下载:
http://www.clsp.jhu.edu/~guoguo/papers/icassp2013_lexicon_value.pdf
论文标题:QUANTIFYING THE VALUE OF PRONUNCIATION LEXICONS FOR KEYWORD SEARCH IN LOW RESOURCE LANGUAGES
该文介绍了LVCSR和KWS系统、词典扩充方法、词典扩充对LVSCR和KWS的影响。
某个关键词在测试集中的出现次数=所有预测命中的后验概率。
词典扩充只能适度降低WER,但是能很大程度地提高随后的ATWV。
论文下载:
https://wiki.inf.ed.ac.uk/twiki/pub/CSTR/ListenSemester2201314/taslp_2011.pdf
论文标题:Lattice indexing for spoken term detection
本文为话语检测技术构建反向索引,具体的,在确定的WFST中存储软命中(soft-hit)信息(utterance-id, start time, end time, posterior score四元组,用于与目标词匹配)。展示了如何在多个Lattice中(多个语句中)生成所有子字符串的索引。
ASR候选解码结果通常储存在带权有向无环图——即lattices中。由于有限状态转换器框架提供了通用的搜索、优化、合并算法,通常使用有限状态转换器来表示ASR Lattice。对以WFST形式的lattice进行索引和搜索的问题,可以被看作是在文本文档中对模式进行搜索的扩展。搜索问题的有限解决办法使用了一种称为因子转换器的结构[12]。一个因子转换器是一个组成一篇文档的字符串集合中子字符串集合的倒排索引。因子转换器是一个非常有效的顺序索引,并且十分适用于需要确切序列匹配的话语检出应用。话语段和口语词检测是两种话语应用,分别用于找到语句以及包含查询词确切序列的语句中的时间间隔。
http://www.clsp.jhu.edu/~guoguo/papers/asru2013_proxy_keyword.pdf
基于WFST的框架用于处理OOV,单词级的
什么是segment?
猜测是关键词。为了进行训练,要为训练数据的语句进行切分,切分为关键词的序列。切分后的关键词序列可能会有字重叠。
什么是F4DE,KWS哪里用到了?
猜测在关键词搜索脚本local/kws_search.sh中使用。
Kaldi中关于KWS的示例:
babel/s5b
KWS的5个阶段:
KWS的数据准备
需要在KWS数据目录中手工准备以下三个文件:
ecf,检索集相关信息
kwlist,关键词列表
rttm,用于KWS打分
Kaldi的关键词搜索(Keyword Search,KWS)
标签:https 实例 搜索 href 切分 解码 www 如何 提升
原文地址:https://www.cnblogs.com/JarvanWang/p/9152660.html