使用定向麦克风进行波束追踪 (Beam Tracking for a Directional Microphone) 可以使用这4个麦克风来模拟定向麦克风产生的效果,这个过程称之为波束追踪(beam tracking) 界面上的细长矩形用来指示某一时刻探测到的说话者的语音方向。矩形有一个旋转变换,在...
分类:
其他好文 时间:
2014-07-19 18:18:08
阅读次数:
276
不涉及语音识别~~ namespace KinectRecordAudio{ /// /// Interaction logic for MainWindow.xaml /// public partial cl...
分类:
其他好文 时间:
2014-07-19 12:24:04
阅读次数:
193
在visual studio 2013中编译kaldi的主要困难的地方在于正确编译kaldi的依赖库,主要是:openfst,ATLAS, pthreadVC2,其中又属ATLAS最难编译,因此,为求整个编译逻辑清晰简洁,在此将忽略kaldi所有依赖库的编译,如果有时间,我会直接提供其所依赖的库.....
分类:
其他好文 时间:
2014-07-16 18:31:36
阅读次数:
3416
Dual Writer是应用老牌界面控件DXperience WinForms Subscription开发的一款语音识别软件,可快速将语音转换为多种格式的文档,支持预览、打印和多种文档格式化。
分类:
其他好文 时间:
2014-07-16 12:18:37
阅读次数:
235
语音操作是可穿戴用户体验的重要部分,可以让用户以快捷、免提的方式执行动作。Wear提供两种类型的语音操作:系统提供(System-provided)这些语音操作是基于任务的,且内置于Wear平台。语音命令到达时,在你想启动的活动(Activity)中进行动作过滤。比如“记一下”(Take a note)或“提醒一下”(Set an alarm)。...
分类:
移动开发 时间:
2014-07-16 08:32:19
阅读次数:
275
现在语音服务越来越热,我们平时使用的很多软件都带有语音合成和识别功能,用起来也很方便。说到语音服务,Google和微软都提供过API接口,不过笔者要介绍的是国内的智能语音技术提供商---科大讯飞。之前看过一个比较Google、微软和科大讯飞语音识别引擎的博文(http://fqctyj.blog.....
分类:
移动开发 时间:
2014-07-13 21:49:06
阅读次数:
387
通过谷歌语音接口的实现语音识别最近在项目中有需要实现语音识别的功能。折腾了几天才搞好。刚开始做的时候没点头绪 ,网上找的资料都是乱七八糟的,要不就是非常古老的实现方法,一些简单的代码片段。所以我决定把我的经验分享给大家。要在IOS中实现语音识别流程如下:录音->pcm格式->转换wav->转换fla...
分类:
其他好文 时间:
2014-07-13 10:53:29
阅读次数:
256
什么是AvayaExriencePortal(AEP)?1:提供语音(或者多媒体)自动化用户体验的软件平台;2:基于标准的VXML(定义了如何使用语音识别、语音合成、互联网访问、数据库访问、语音文件播放、DTMF输入等功能开发一个完整的语音应用系统。)和CCXML(它基于XML定义了一系列开放标准..
分类:
其他好文 时间:
2014-07-08 12:12:27
阅读次数:
525
开发 —— 基本的SDK和Windows 编程技巧(彩色图像视频流,深度图像视频流的采集,骨骼跟踪,音频处理,语音识别API) 深度数据,就是Kinect的精髓和灵魂,很多问题都转换为深度图像的模式识别问题 AForge.NET 是一套C#编写的Framework,提供计算机视觉,机器学习 www....
针对ASR的语音信号分析
特征
频谱分析
倒谱分析
标准特征:MFCC和PLP分析
动态特征...
分类:
其他好文 时间:
2014-07-03 17:41:52
阅读次数:
591