语音识别:是以语音为研究对象,通过语音信号处理和模式识别让机器自动识别和理解人类口述的语。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。 语音识别应用业务场景特点: 1. 离线 /在线(又称实时) 在线对网络要求高,存在丢数据情况,非业务数据可容忍. 2. 长语音 ...
分类:
其他好文 时间:
2020-02-17 18:11:53
阅读次数:
99
简称SD,顾名思义,在采集的语音信号流中,分辨出不同说话人的说话时长并标注。参照2010年8月的文献[1]中的一张图: 又称说话人分割,在语音信号处理的多种场景下均有应用需求,近年来也被多来越多的研究者所关注。SD的方法分为以下两种:1)无监督方法,比如谱聚类以及k均值等;2)监督方法,深度神经网络 ...
分类:
其他好文 时间:
2020-01-04 20:09:39
阅读次数:
582
语音学三个分支: 1. 发音语音学 2. 声学语音学 进一步出现了声音模拟、语音合成、语音识别 3. 听觉语音学和心理语言学 研究人耳和大脑 本章介绍语音产生的过程及人耳的听觉过程,传统的线性语音产生模型以及目前广泛受到重视的非线性 语音产生模型,这些都是从事语音信号处理研究的基础知识。 2.1 语 ...
分类:
其他好文 时间:
2019-12-21 11:55:38
阅读次数:
100
信噪比(SNR) 有用信号功率与噪声功率的比(此处功率为平均功率),也等于幅度比的平方 $$SNR(dB)=10\log_{10}\frac{\sum_{n=0}^{N-1}s^2(n)}{\sum_{n=0}^{N-1}d^2(n)}=10*\log_{10}(\frac{P_{signal}}{ ...
分类:
其他好文 时间:
2019-09-11 17:53:29
阅读次数:
261
折腾了两天,几乎试了网上说的所有方法(就差重装系统了,看到有人说重装系统之后还是同样的问题,果断放弃重装),visual studio 2017的安装问题终于解决了,为了帮助同样还在折腾的初级开发者们,特写将这两天的遭遇整理成文以供参考,希望能帮到有需要的人。 最近在学习python的语音信号处理, ...
分类:
Windows程序 时间:
2019-05-19 14:30:42
阅读次数:
2146
声域:声音太低、频率过高或过低我们都无法听到,人耳能够听到的声音频率和强度的范围称之为声域。 心理声学:人们对声音的主观感受,典型的例子:噪音刺耳、歌声悦耳。主要有响度、音高、音色、掩盖和定位等特征。 音长:振动持续的时间长短决定声音持续长久。 掩盖效应(鸡尾酒效应):在多种音源的情况下,频率接近的 ...
分类:
其他好文 时间:
2019-05-13 12:37:25
阅读次数:
194
数字信号处理课设,我们使用MATLAB对语音信号进行了一系列处理,并将其所有功能集中于下图界面中: 这个界面涉及功能众多,其中包括语音信号的观察分析、音色变换、AM调制解调、减抽样、加噪去噪、相频分析和幅频滤波等,最重要的是对MATLAB中函数的掌握,通过不同函数的组合实现你想要实现的功能。 本篇不 ...
分类:
其他好文 时间:
2019-01-19 11:08:10
阅读次数:
315
声音的输入输出 标准的python已经支持WAV格式的书写,而实时的声音输入输出需要安装pyAudiio(http://people.csail.mit.edu/hubert/pyaudio)。最后我们还将使用pyMedia(http://pymedia.org)进行Mp3的解码和播放。 掌握了上面 ...
分类:
编程语言 时间:
2018-12-06 20:28:23
阅读次数:
680
一、图形界面设计 1.新建GUI界面 2.新建空白页 3.命名为"yydsp",打开界面 4.拖放控件 5.按预定功能修改界面 6.填写Callback函数 未填写前的代码: 填写后的代码 1)打开文件部分 程序中,resample为信号降采样处理,理解如下:B=resample(x,90,250) ...
分类:
其他好文 时间:
2018-10-27 21:08:42
阅读次数:
253
【摘要】语音检测是语音信号处理的前端,利用长时谱能量差异特征的语音检测无法区分突发噪声和语音,掺杂着突发噪声的语音信号会对语音处理系统带来不良影响。提出了一种基于长时谱能量差异特征和基音比例特征相结合的语音检测方法,该方法的优点是,在利用长时谱能量差异特征基础上引入基音比例特征,从而有效减少了将信号 ...
分类:
其他好文 时间:
2018-08-22 17:10:21
阅读次数:
175