2.5 在回答你的第三个问题之前,我们先来看一下声音的第三种表示方式——
语谱图(
spectrogram)。上面说过,频谱只能表示一小段声音。那么,如果我想观察一整段语音信号的频域特性,要怎么办呢?我们可以把一整段语音信号截成许多帧,把它们各自的频谱“竖”起来(即用纵轴表示频率),用颜色的深浅来代替频谱强度,再把所有帧的频谱横向并排起来(即用横轴表示时间),就得到了语谱图,它可以称为声音的
时频域表示。下面我就偷懒,不用Matlab自己画语谱图,而用Cool Edit绘制上面“pass”的语谱图,如下:
注意横轴是时间,纵轴是频率,颜色越亮代表强度越大。可以观察一下0.17s和0.4s处,是不是跟我上面画的频谱相似?然后再试着从这张语谱图上读出元音/æ/的第二共振峰频率。
语谱图的好处是可以直观地看出共振峰频率的变化。我上面读的“pass”中只有一个单元音,如果有双元音就会非常明显了。比如下面这张我读的“eye” /a?/,可以非常明显地看出在元音从/a/向/?/过渡的阶段(0.2 ~ 0.25s),
在降低,而
在升高。
3. 元音与共振峰的关系已经研究得比较透彻了,简单地说:
1) 开口度越大,
越高;
2) 舌位越靠前,
越高;
3) 不圆唇元音的
比圆唇元音高。
例如,/ɑ/是开、后、不圆唇元音,所以
高,
低,
高;/y/(即汉语拼音的ü)是闭、前、圆唇元音,所以
低,
高,
低。
也许题主见过下图那样的元音图(vowel chart),我把
和
的变化方向标了上去。
最明显的体现其实是在英语的辅音/r/中,例如下面我读的erase /?‘re?z/的语谱图,可以看到辅音/r/处(0.19s左右)
明显低,把
也压下去了。
清擦音可以根据能量集中的频段来分辨。下面是我读的/f/, /θ/, /s/, /?/的语谱图。浊擦音会在清擦音的基础上有周期性的精细结构。
爆破音的爆破时间很短,在语谱图上一般较难分辨。