原理 短时傅里叶变换(Short Time Fourier Transform, STFT) 是一个用于语音信号处理的通用工具.它定义了一个非常有用的时间和频率分布类, 其指定了任意信号随时间和频率变化的复数幅度. 实际上,计算短时傅里叶变换的过程是把一个较长的时间信号分成相同长度的更短的段, 在每 ...
分类:
编程语言 时间:
2018-07-08 20:38:42
阅读次数:
2194
考虑可能的研究方向时候,主要从下面两个角度考虑。 技术和理论不外乎信号处理以及机器学习方向,但需要提托于特定背景或者应用。下面逐一分析: 不熟悉 没有任何积累 1 有积累,尤其是语音信号处理。 2 语音和文本是人们交互主要方式,语音能解放双手,属于自然的信号输入模式。 3 与nlp关联强;与图像方向 ...
分类:
其他好文 时间:
2018-05-12 18:30:50
阅读次数:
143
语音信号处理要达到的一个目标,就是弄清楚语音中各个频率成分的分布。做这件事情的数学工具是傅里叶变换,但傅里叶变换要求输入信号是平稳的,而语音在宏观上来看是不平稳的(波形很不均匀)。语音信号特征是随时间变化而变化的,是一个非平稳的随机过程。但从微观上看,虽然语音信号具有时变特征,但在一个短时间内其特征 ...
分类:
其他好文 时间:
2018-04-27 19:56:02
阅读次数:
129
GMM-HMM语音识别模型原理篇隐马尔科夫模型-HMM-ATutorialOnHiddenMarkovModels0.概念:语音信号处理/模式识别/统计分析,1.算法:常用的深度学习算法,包括cnn/dnn/rnn/lstm;GMM/SVM/CRF/MaxEnt/HMM;对CTC有经验;2.框架:熟悉至少一种深度学习框架,包括kaldi,tensorflow,caffe,mxnet等;常用工具如C
分类:
其他好文 时间:
2018-04-03 17:24:57
阅读次数:
344
一、概述 作为最自然的人机交互方式 --语音,正在改变人们的生活,丰富多媒体技术的应用。语音识别技术是语音信号处理的一个重要分支,也是近年来非常火的一个研究领域。随着科技的飞速发展,语音识别不仅在桌面PC和大型工作站得到了广泛应用,并且在嵌入式系统领域也占有一席之地。如智能家居、苹果的Siri、车载 ...
分类:
其他好文 时间:
2017-06-18 16:50:10
阅读次数:
265
转自:http://blog.csdn.net/zouxy09/article/details/9140207 语音信号处理之(一)动态时间规整(DTW) zouxy09@qq.com http://blog.csdn.net/zouxy09 这学期有《语音信号处理》这门课,快考试了,所以也要了解了 ...
分类:
其他好文 时间:
2016-06-06 10:25:53
阅读次数:
209
http://max.book118.com/html/2014/0814/9432056.shtm ASR技术的基础主要是信号处理和概率模型。 信号处理技术 语音信号处理 谱分析 基于时间的概率模型 HMM隐马尔柯夫模型 语言模型 专门针对普通话的语言分析 专门针对普通话的语言分析 ...
分类:
其他好文 时间:
2016-05-27 20:00:15
阅读次数:
117
4.3 滤波器的解释 1.短时傅里叶变换的滤波器实现形式一 2.短时傅里叶变换的滤波器实现形式二 令: 则: 4.4 短时谱的时域及频域採样率 短时傅里叶变换是一维信号的二维表示。即同一时候是时间n以及角频率w的函数。怎样由来恢复,首先遇到的就是时域採样率和频域採样率的问题。 1.时域採样率 在时间
分类:
其他好文 时间:
2016-02-17 20:41:39
阅读次数:
154
5.1 概要 进行处理的方法,它能将两个信号通过乘法合成的信号,或通过卷积合成的信号分开。对于语音信号。我们的目的是要从声道冲激对应与激励分量的卷积中分开各原始分量。由卷积结果求得參与卷积的各个信号分量是涉及数字信号处理理论的一项任务,称为“解卷积”或简称“解卷”。 对语音信号进行同态分析后...
分类:
其他好文 时间:
2015-07-08 18:28:55
阅读次数:
121
数字语音是信号的一种,我们处理数字语音信号,也就是对一种信号的处理,那信号是什么呢?信号是传递信息的函数。离散时间信号——序列——可以用图形来表示。按信号特点的不同,信号可表示成一个或几个独立变量的函数。例如,图像信号就是空间位置(二元变量)的亮度函数。一维变量可以是时间,也可以是其他参量,习惯上将...
分类:
其他好文 时间:
2015-05-23 18:06:44
阅读次数:
262