一. CNN的生物原理,应用以及优点 CNN根据人眼睛视觉神经的局部感受野特点设计,广泛应用在图像图像,模式识别,机器视觉和语音识别中,它对图像平移、缩放、旋转等的变形具有高度不变性。总之,CNN的核心思想是将局部感受野,权值共享,时间或空间子采样这三种思想结合起来获得了某种程度的平移、缩放、旋转不 ...
分类:
其他好文 时间:
2016-07-07 06:10:09
阅读次数:
475
第一步:启动windows 语音识别窗口 第二步:设置windows 语音识别窗口 第三步:使用windows 语音识别窗口来输入文字 成功 ...
深度神经网路已经在语音识别,图像识别等领域取得前所未有的成功。本人在多年之前也曾接触过神经网络。本系列文章主要记录自己对深度神经网络的一些学习心得。 第二篇,讲讲经典的卷积神经网络。我不打算详细描述卷积神经网络的生物学运行机理,因为网络上有太多的教程可以参考。这里,主要描述其数学上的计算过程,也就是 ...
分类:
Web程序 时间:
2016-07-03 11:47:06
阅读次数:
255
在以前的项目中用到了百度语音识别服务,在这里做一个笔记。这里还是要和大家强调一下,最好的学习资料就是官网网站。我这里只是一个笔记,一方面整理了思路,另一方面方便以后我再次用到的时候可以快速回忆起来。百度语音识别服务是什么?百度语音识别服务能将语音文件(指定格式,不是所有格式都可以)识别成文本。语音识别我们都接触过,手机输入法里就有语音识别服务。什么是百度语音识别的 REST API?按照官网的说法...
智能语音技术
如今越来越多的app用到了语音播报功能,例如地图导航、天气预报、文字阅读、口语训练等等。语音技术主要分两块,一块是语音转文字,即语音识别;另一块是文字转语音,即语音合成。
对中文来说,和语音播报相关的一个技术是汉字转拼音,想想看,拼音本身就是音节拼读的标记,每个音节对应一段音频,那么一句的拼音便能用一连串的音频流合成而来。汉字转拼音的说明参见《Android开发笔记(八十...
分类:
移动开发 时间:
2016-06-27 10:40:50
阅读次数:
780
还记得前不久2016谷歌开发者I/O大会上展示的人工智能语音搜索助理GoogleAssistant以及基于该语音助理的智能硬件GoogleHome吗?它们的背后是准确的英文语音识别能力。如今,以微软Cortana、苹果Siri和GoogleAssistant为第一军团的人工智能语音识别技术正在大规模商业化与产品化..
分类:
其他好文 时间:
2016-06-23 19:00:39
阅读次数:
193
RealSense 3D(实感3D)是英特尔提供的一套感知计算解决方案,包括了手势的识别、控制,人脸的识别、认证、控制,语音识别与控制,增强现实,3D扫描和重构等许多先进的技术。包括立体眼镜(暂未公开),RealSense 3D摄像头(F200和R200)和Snapshot,还包括驱动及软件等全套开 ...
分类:
其他好文 时间:
2016-06-22 20:18:24
阅读次数:
890
6.24 AppCan移动开发者大会进入倒计时,报名通道即将关闭! 50多家移动圈服务商将出席此次大会,讯飞开放平台也将作为参展商,为参会者带去前沿的语音技术。参会者可现场体验最新连续语音识别技术,识别准确率超过95%,语音输入速度180字/分,识别结果响应时间≤500ms。 ...
分类:
移动开发 时间:
2016-06-22 15:17:26
阅读次数:
185
delphi调用百度语音识别REST API-20160616-感谢 魔术猫 和 DelphiTeacher 兄的帮助解决了返回中文乱码的问题!-注:语音的录音格式目前只支持评测8k/16k采样率16bit位深的单声道语音 压缩格式支持:pcm(不压缩)、wav、opus、speex、amr、x-f ...