5月16日,“让世界聆听我们的声音”——2014年语音云开发者沙龙暨“聚焦语音交互引爆智能硬件”在杭州贝塔咖啡成功举办。自2013年8月以来,由讯飞语音云举办的开发者沙龙已走过北京、上海、深圳、成都、合肥、厦门等地,与1000多名开发者亲密接触,爆棚的场面、忘我的分享和激..
分类:
其他好文 时间:
2014-05-27 03:41:22
阅读次数:
228
SDL的介绍
SDL是Simple DirectMedia Layer(简易直控媒体层)的缩写。它是一个跨平台的多媒体库,以用于直接控制底层的多媒体硬件的接口。这些多媒体功能包括了音频、键盘和鼠标(事件)、游戏摇杆等。当然,最为重要的是提供了 2D图形帧缓冲(framebuffer)的接口,以及为 OpenGL 与各种操作系统之间提供了统一的标准接口以实现 3D图形。从这些属性我们可以...
分类:
其他好文 时间:
2014-05-22 12:21:15
阅读次数:
718
基于能量和过零率的语音端点检测&基音周期估值...
分类:
其他好文 时间:
2014-05-22 10:05:20
阅读次数:
260
数字语音信号处理学习笔记——语音信号的短时时域分析(3)...
分类:
其他好文 时间:
2014-05-22 07:12:12
阅读次数:
311
不知不觉,版本以每周更新一次的脚步进行着,接下来应该是重构我的代码及框架的结构,有朋友反应代码有点乱,确实如此,当时写的时候只是按照订阅号来写的,后来才慢慢增加到支持API接口。目前还在开发第三方微信平台,旨在使用户能够无需自己开发就能简易搭建微信平台。
更新内容 1、增加支持语音识别 2、增加“网...
分类:
微信 时间:
2014-05-22 02:35:53
阅读次数:
1097
ffmpeg 源代码简单分析 : av_read_frame()
http://blog.csdn.net/leixiaohua1020/article/details/12678577ffmpeg中的av_read_frame()的作用是读取码流中的音频若干帧或者视频一帧。例如,解码视频的时候,....
分类:
其他好文 时间:
2014-05-21 22:21:52
阅读次数:
541
语音技术是研究用数字信号处理技术和机器学习方法对语音信号进行处理的一门学科。语音技术的目的:
得到某些参数以便高效传输或存储;或者是用于某种应用,如人工合成出语音、辨识出讲话者、识别出讲话内容、进行语音增强等。
语音编码:在保持可以接受的失真的情况下,采用尽可能少的比特数表示语音。脉冲编码调制(PC...
分类:
其他好文 时间:
2014-05-21 21:53:13
阅读次数:
320
第一章 语言模型(Michael Collins的自然语言处理课程讲义,哥伦比亚大学) 1.1
介绍在这一节,我们将考虑一个问题,即如何为一个例句集建立语言模型。语言模型最初从语音识别发展起来;对现代的语言识别系统,语言模型依然起着中心作用。语言模型在其他自然语言处理应用中也被广泛应用。我们将在本章...
分类:
其他好文 时间:
2014-05-21 19:57:32
阅读次数:
404
1.短时能量分析(音强),决定短时能量特性有两个条件:不同的窗口的形状和长度。窗长越长,频率分辨率越高,而时间分辨率越低(N为帧长,M为步长)。
*典型窗函数:矩形窗谱平滑性能好,但损失高频成分,波形细节丢失,海明窗与之相反。一帧内含1~7个基音周期,10kHz下采100~200点。 2.短时平均振...
分类:
其他好文 时间:
2014-05-21 19:41:53
阅读次数:
682
结构化布线系统
结构化综合布线系统(Structure Cabling System)是基于现代计算机技术的通信物理平台,集成了语音、数据、图像和视频的传输功能,消除了原有通信线路在传输介质上的差别。
工作区子系统 Work Location
工作区子系统是由终端到信息插座的整个区域。一个独立的需要安装终端设备的区域划分成一个工作区。工作区应支持电话、数据终端、计算机、电视机、监视器以及传感...
分类:
其他好文 时间:
2014-05-21 08:47:19
阅读次数:
257