TIMIT语音库是IT和MIT合作音素级别标注的语音库,用于自动语音识别系统的发展和评估,包括来自美式英语,8个地区方言,630个人。 每个人读10个句子,每个发音都是音素级别、词级别文本标注,16kHz,16bit。 注意:不用使用TIMIT配置作为运行Kaldi的一个通用型例子,因为它不是一个非 ...
分类:
其他好文 时间:
2017-09-15 13:42:57
阅读次数:
285
steps/diagnostic/analyze_alignments.sh --cmd run.pl --mem 4G data/lang exp/monosteps/diagnostic/analyze_alignments.sh: see stats in exp/mono/log/analy ...
分类:
其他好文 时间:
2017-09-15 13:41:31
阅读次数:
212
转自: http://blog.csdn.net/wbgxx333/article/details/24932533 本文是kaldi学习联盟中@冒顿翻译的,下面是@冒顿的翻译结果,在这里感谢@冒顿的辛勤劳动,希望更多的人加入到这个翻译上来,为更多的人学习…… 因为我们翻译的文档都有url,csdn ...
分类:
其他好文 时间:
2017-09-13 13:18:05
阅读次数:
167
转自:http://blog.csdn.net/chenhoujiangsir/article/details/51613144 说明:本文是kaldi主页相关内容的翻译(http://kaldi-asr.org/doc/tree_externals.html)。目前网上已经有一个翻译的版本,但翻译 ...
分类:
其他好文 时间:
2017-09-12 18:35:29
阅读次数:
903
text中每一个文本段由一个音频索引(indexed by utterance) 使用该方式的egs:librispeech、timit、thchs30、atc_en、atc_cn 语料的组织形式为: 一个音频(包含一个语句)对应一个文本(包含一个文本段) 或 一个音频(包含一个语句)对应一个文本(... ...
分类:
其他好文 时间:
2017-09-09 23:18:38
阅读次数:
363
At the moment Kaldi is targeted more at people who are building ASR systems than those who just want to use them. We may in future cater to needs such... ...
分类:
其他好文 时间:
2017-09-09 23:18:21
阅读次数:
1302
Delta特征是将mfcc特征(13维)经过差分得到的 它是做了一阶二阶的差分 提取的mfcc特征是13维的 然后通过delta就变成了39维 一阶差分: D(P(t))=P(t)-P(t-1) 二阶差分: D(D(P(t)))=(P(t)-P(t-1))-(P(t-1)-P(t-2)) Delta... ...
分类:
其他好文 时间:
2017-09-09 23:16:49
阅读次数:
753
FixedAffineComponent:类 LDA-like 的非相关转换,由标准的 weight matrix plus bias 组成(即Wx+b),通过标准的 stochastic gradient descent(非minibatch SGD?) 训练而来,使用 global learni... ...
分类:
Web程序 时间:
2017-09-09 23:14:20
阅读次数:
443
xent_regularize, Cross Entropy Regularize nnet3/nnet-discriminative-trainning.cc:109 void NnetDiscriminativeTrainer::ProcessOutputs() 交叉熵正则化,即帧平滑 《解读深... ...
分类:
其他好文 时间:
2017-09-09 23:13:18
阅读次数:
326
Kaldi官方网站地址:http://www.kaldi-asr.org/ 下载Kaldi代码 git clone https://github.com/kaldi-asr/kaldi.git ...
分类:
其他好文 时间:
2017-08-11 20:26:37
阅读次数:
148