G.711 G.711 也称为PCM(脉冲编码调制),是国际电信联盟订定出来的一套语音压缩标准,主要用于电话。它主要用脉冲编码调制对音频采样,采样率为8k每秒。它利用一个 64Kbps 未压缩通道传输语音讯号。 起压缩率为1:2, 即把16位数据压缩成8位。G.711是主流的波形声音编解码器。 G. ...
分类:
其他好文 时间:
2019-01-24 21:56:57
阅读次数:
172
【引言】--PCA降维的作用 面对海量的、多维(可能有成百上千维)的数据,我们应该如何高效去除某些维度间相关的信息,保留对我们“有用”的信息,这是个问题。 PCA给出了我们一种解决方案和思路。 PCA给我的第一印象就是去相关,这和数据(图像、语音)压缩的想法是一致的。当然,PCA像是一种有损的压缩算 ...
分类:
其他好文 时间:
2016-12-19 21:26:29
阅读次数:
918
[objc] view plain copy [objc] view plain copy [objc] view plain copy <span style="white-space:pre"> </span>这次Demo使用的是Speex对录制的声音进行语音压缩,并且进行ogg的封装。由于本人 ...
分类:
移动开发 时间:
2016-07-10 21:44:28
阅读次数:
1003
delphi调用百度语音识别REST API-20160616-感谢 魔术猫 和 DelphiTeacher 兄的帮助解决了返回中文乱码的问题!-注:语音的录音格式目前只支持评测8k/16k采样率16bit位深的单声道语音 压缩格式支持:pcm(不压缩)、wav、opus、speex、amr、x-f ...
G.729语音压缩编译码算法
采用算法是共轭结构的代数码激励线性预测(CSACELP),是基于CELP编码模型的算法;能够实现很高的语音质量(长话音质)和很低的算法延世;算法帧长为10ms,编码器含5ms前瞻,算法时延15ms;其重建语音质量在大多数工作环境下等同于32kb/s的ADPCM(G.726),MOS分大于4.0;编码时输入16bitPCM语音信号,输出2进制比特流;译码时输入为2进制...
分类:
其他好文 时间:
2015-07-12 15:42:14
阅读次数:
108
书接上一回。
前文提到如何利用协议编码好音频pcm数据,使其在解码的时候可以用于ios系统与Android系统。现在是解码部分,解码部分主要是获取到.spx文件的全部字节,然后根据前文的协议,先获取到.spx的头信息,在头信息中获取到音频的相关参数,然后初始化播放器,再把每一帧解码出来进行播放。关于协议部分,可以有很多种协议方式,可以沿用speex_header.h定义的方式也可以,我选择了最方便...
分类:
移动开发 时间:
2015-07-09 11:18:39
阅读次数:
151
语音和图像、视频一样,是人与人之间沟通的交流方式。
语音信号处理是一门综合性的学科,它与语音学、心理学、数字信号处理、计算机科学、模式识别等有着密切联系。
语音技术一般可以分为三大类:
1.人与人之间的通信:语音增强、语音编码、语音通信、VOIP等
简单的说,以网络为载体,实现人与人之间的语音通信,涉及到语音前端去噪,增强,语音压缩编码等。
语...
分类:
其他好文 时间:
2015-04-30 14:19:34
阅读次数:
156
语言聊天中的压缩利器Speex最近项目组在着手开发一个IM项目,即时聊天App.所以在工程师们正在搭建后台服务器的时候,我必须解决一些前端和后端交互数据的一些事宜,例如协议,心跳包等。关于语音聊天的难点在于语音的压缩加密。
参考了以下文章之后,决定是用Speex这个开源利器来压缩语音吧。
http://code.csdn.net/news/313194Google了以下Speex,很多demo信...
分类:
编程语言 时间:
2015-04-01 13:24:14
阅读次数:
345
可视电话的主要功能是点对点的视频通信,即支持彩色活动图像及语音的双向实时传输。可视电话从概念的提出、第二十世纪九十年代以后,计算机和芯片技术的进步,图像、语音压缩编码技术得到快速发展,特别是国际上1996年推出的全世界统一的多媒体可视电话标准,其发展已经历了几十年之久。在今天的多媒体通讯时代,可视电话又展现出了广阔的发展前景。
目前,国内外主流的视讯设备都采用基于ITUT H系列...
分类:
其他好文 时间:
2015-01-27 14:57:27
阅读次数:
192