5、《Speech recognition with speech synthesis models by marginalising over decision tree leaves》_1

时间：2015-04-09 00:45:56 阅读：179 评论：0 收藏：0 [点我收藏+]

标签：

2.1 Decision Tree Marginalization

现在决策树边缘化的基本过程已经了解了
1. 简单叙述一下：
  1. 这个决策树是HMM合成的决策树
  2. 给定的triphone标注是：r-ih+z
  3. 然后，根据给定的triphone标注，利用当前的语音合成的模型，去推理得到语音识别的模型
  4. 对给定的triphone利用当前的语音合成的决策树，从根节点开始往下跑
    1. 根节点问题，右边的是清音吗？右边的音明显是z，是浊音，
    2. 所以前往左边的节点，然后问题是：音节是重度吗？擦，这个问题在上下文信息中是没有的，怎么办？
    3. 既然是没有的那么我要把这个中间节点的左孩子，纳入最终的识别模型的计算中，
    4. 然后往右边节点去，问题是：右边是擦音吗？是，进入右边叶子节点
    5. 最终对于r-ih+z的识别模型的参数计算，要结合G1，还有G3一起来计算。
2. 我大概明白了，决策树边缘化是怎么用来做cross-lingual的adaptation了。
  1. 是不是把先把一种语言，例如英语的语料，训练得到Average voice model，然后会得到上图所示的决策树。
  2. 然后，得到另外一种语言的模型文件，就可以从从英语的根节点开始，遍历决策树，然后得到粤语的模型文件，
  3. 例如，给定一个粤语的上下文信息，
    -jyu+6#sil+x$kei+4&0+0!0+0|0+...0#0^0#0_0#0-0$0&0$0!0$0|
  4. 然后，去遍历英语的决策树，最终粤语的这个音节的模型文件，是英语的几个叶子节点的参数的线性组合。
  5. 上面仅仅是猜测，不一定是正确的
但是，不明白的是原理是什么？
1. 为什么在对triphone进行决策树遍历的时候，要把与当前triphone上下文信息无关的问题的中间节点的孩子节点纳入对该triphone进行进行识别的最终的参数计算当中？？
现在要研究清楚的是，决策树边缘话，怎么就能用来说unsupervised的intra-lingual的说话人自适应呢？个过程是怎样的？
1. m

5、《Speech recognition with speech synthesis models by marginalising over decision tree leaves》_1

标签：

原文地址：http://www.cnblogs.com/yu-blog/p/4405130.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行