本文将对几种音频混音的方法进行详细的介绍和比较,读完之后你应该可以对混音有个基本的认识,针对不同情形知道应该采用哪种具体的处理方法了。 如果对音频的一些基础知识还不是很了解的建议先去阅读一下上一篇文章:写给小白的音频认识基础 。 混音的原理 音频混音的原理: 空气中声波的叠加等价于量化的语音信号的叠 ...
分类:
移动开发 时间:
2018-09-24 14:40:14
阅读次数:
208
自古以来,人类对人工智能就有持久、狂热的追求,从语音识别到智能音箱,从无人驾驶到人机对战,人工智能给人类社会带来了一次又一次的惊喜,被人工智能赋能的各行各业都在焕发新的生机。在人工智能垂直领域商业化繁荣的背后,是基础层的软硬件支撑,以及技术层的语音识别/自然语言处理、计算机视觉等应用的渐入佳境。2018年8月26日,百度为2018人工智能创意赛集训营邀请了中国高校计算机大赛人工智能创意赛专家委员会
分类:
其他好文 时间:
2018-09-21 19:00:38
阅读次数:
158
一、说明 如果有一个工具能识别音视中的语音并转换成文字输出,由于可以复制粘贴而不需要逐字逐句地打,那我们进行为音频配字幕工作时将会事半功倍。 其中的关键点是音文转换,音文转换其实在很多地方都可以看到比如qq,百度搜索,讯飞输入法等等,具体到技术而言前述的三个场景其背后的技术都是一样的,都是利用AI进 ...
分类:
其他好文 时间:
2018-09-07 14:09:52
阅读次数:
216
欢迎大家前往 "腾讯云+社区" ,获取更多腾讯海量技术实践干货哦~ 本文由 "腾讯游戏云" 发表于 "云+社区专栏" 第十八届亚运会在印度尼西亚首都雅加达进行得如火如荼,电子竞技作为2018亚运会的表演赛项目,首次登上亚运会的舞台。对于团队合作的电竞赛事来说,队友间的“语音”交流不可或缺。实时与队友 ...
分类:
其他好文 时间:
2018-09-03 13:38:19
阅读次数:
174
项目中需要利用百度语音接口在Web端实现语音识别功能,采用了这样的技术方案,但实现时遇到了很多问题,发现网上大部分文章都只是在详解官方提供的example示例,对实际开发没有提供什么有价值的建议,而 是无法直接适配百度AI的语音接口的,故本篇将开发中各个细节点记录与此,欢迎指点交流。 一. 技术栈选 ...
分类:
Web程序 时间:
2018-09-01 23:51:32
阅读次数:
236
#import #import @interface SpeechListener : NSObject @property(nonatomic,strong)SFSpeechRecognizer *listener; @property(nonatomic,strong)SFSpeechRecog... ...
分类:
移动开发 时间:
2018-09-01 17:36:32
阅读次数:
534
[toc] 最小语音识别模型 输入 音频特征向量,共计26维的mfcc特征向量 为了使神经网络能够统一格式,将[batch_size, time_step, 26]中的time_step定为一个较大的值,如果实际时长不足,采用补零的方法补齐 输出 输出为一个[batch_size, words_le ...
分类:
其他好文 时间:
2018-08-24 00:28:43
阅读次数:
971
功能简介: 不需要借助百度的语音SDK即可完成,只需要通过前端语言利用页面获取用户语音直接将语音数据发送给后端保存,之后通过条件判断再将保存好的语言文件地址发送给目标用户,借此即可完成用户之间的单点通信 前端代码 ...
分类:
其他好文 时间:
2018-08-23 00:33:31
阅读次数:
267
【摘要】语音检测是语音信号处理的前端,利用长时谱能量差异特征的语音检测无法区分突发噪声和语音,掺杂着突发噪声的语音信号会对语音处理系统带来不良影响。提出了一种基于长时谱能量差异特征和基音比例特征相结合的语音检测方法,该方法的优点是,在利用长时谱能量差异特征基础上引入基音比例特征,从而有效减少了将信号 ...
分类:
其他好文 时间:
2018-08-22 17:10:21
阅读次数:
175