码迷,mamicode.com
首页 > 其他好文 > 详细

5、《Speech recognition with speech synthesis models by marginalising over decision tree leaves》_1

时间:2015-04-09 00:45:56      阅读:179      评论:0      收藏:0      [点我收藏+]

标签:

2.1 Decision Tree Marginalization

  1. 现在决策树边缘化的基本过程已经了解了
    1. 简单叙述一下:技术分享
      1. 这个决策树是HMM合成的决策树
      2. 给定的triphone标注是:r-ih+z
      3. 然后,根据给定的triphone标注,利用当前的语音合成的模型,去推理得到语音识别的模型
      4. 对给定的triphone利用当前的语音合成的决策树,从根节点开始往下跑
        1. 根节点问题,右边的是清音吗?右边的音明显是z,是浊音,
        2. 所以前往左边的节点,然后问题是:音节是重度吗?擦,这个问题在上下文信息中是没有的,怎么办?
        3. 既然是没有的那么我要把这个中间节点的左孩子,纳入最终的识别模型的计算中,
        4. 然后往右边节点去,问题是:右边是擦音吗?是,进入右边叶子节点
        5. 最终对于r-ih+z的识别模型的参数计算,要结合G1,还有G3一起来计算。
    2. 我大概明白了,决策树边缘化是怎么用来做cross-lingual的adaptation了。
      1. 是不是把先把一种语言,例如英语的语料,训练得到Average voice model,然后会得到上图所示的决策树。
      2. 然后,得到另外一种语言的模型文件,就可以从从英语的根节点开始,遍历决策树,然后得到粤语的模型文件,
      3. 例如,给定一个粤语的上下文信息,

        -jyu+6#sil+x$kei+4&0+0!0+0|0+...0#0^0#0_0#0-0$0&0$0!0$0|

      4. 然后,去遍历英语的决策树,最终粤语的这个音节的模型文件,是英语的几个叶子节点的参数的线性组合。
      5. 上面仅仅是猜测,不一定是正确的
  2. 但是,不明白的是原理是什么?
    1. 为什么在对triphone进行决策树遍历的时候,要把与当前triphone上下文信息无关的问题的中间节点的孩子节点纳入对该triphone进行进行识别的最终的参数计算当中??
  3. 现在要研究清楚的是,决策树边缘话,怎么就能用来说unsupervised的intra-lingual的说话人自适应呢?个过程是怎样的?
    1. m  

5、《Speech recognition with speech synthesis models by marginalising over decision tree leaves》_1

标签:

原文地址:http://www.cnblogs.com/yu-blog/p/4405130.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!