深度学习是近十年来人工智能领域取得的最重要的突破之一。它在语音识别、自然语言处理、计算机视觉、图像与视频分析、多媒体等诸多领域都取得了巨大成功。本文将重点介绍深度学习在物体识别、物体检测、视频分析的最新研究进展,并探讨其发展趋势。1. 深度学习发展历史的回顾现有的深度学习模型属于神经网络。神经网络的历史可追述到上世界四十年代,曾经在八九十年代流行。神经网络试图通过模拟大脑认知的机理,解决各种机器学习...
分类:
其他好文 时间:
2015-06-03 21:35:24
阅读次数:
1289
深度学习允许由多个处理层组成的计算模型来学习多个抽象层数据的表示。这些方法大大提高了目前最先进的语音识别,可视对象识别,目标检测和其他诸多领域如药物发现和基因组。深度学习发现大数据集结构很复杂,该结构使用BP算法来指示机器应该如何改变内部参数,这些参数是用于从前一层的表示来计算每层的表示。深度卷积网已经在处理图像,视频,语音和音频方面取得了突破,而递归网已经触及到连续数据,如文本和语音。机器学习技术...
分类:
其他好文 时间:
2015-05-29 23:16:36
阅读次数:
245
统计语言模型(Statistical Language Model)是一个数学模型,它是所有自然语言处理的基础,广泛应用于机器翻译、语音识别等领域,它产生的初衷是为了解决语言识别问题。 ? ? 自然语言处理中,对于如何判...
分类:
编程语言 时间:
2015-05-29 16:05:07
阅读次数:
189
语音识别主要的功能就是在用户不方便输入的时候一个替代输入的选择。
1.本地语音识别
下面的代码首先创建SpeechRecognizer对象,并设置回调函数监听器。当在点击监听器中调用doSpeechRecognition()方法时,会使用语言参数和一个指示在处理过程中分发部分结果的标志参数初始化语音识别。
public class MainActivity extends...
分类:
其他好文 时间:
2015-05-28 21:34:24
阅读次数:
180
自然语言的处理,主要是实现人与计算机之间用自然语言进行有效通信的方法和理论,它经历了从规则到统计的阶段,所谓规则,是指根据定义的语法进行语言的处理,所谓统计,是指IBM为解决语音识别问题提出的自...
分类:
编程语言 时间:
2015-05-28 16:32:13
阅读次数:
270
你有试过边走路边玩手机吗?你有试过边上楼梯边玩手机吗?你有试过边横穿马路边玩手机吗?你有试过边横穿马路边玩手机,而且还不抬头看路和车吗?是的,聪明的你肯定知道我想跟你说什么。那就是:这很危险。
据报道,上周,广东中山坦洲镇发生一起惨烈的交通事故:一名年轻女子一边过马路,一边使用手机。大概是因为注意力都在手机…………
如何用智能技术助你安全地边玩手机边过马路呢?...
分类:
移动开发 时间:
2015-05-27 15:49:38
阅读次数:
179
这篇文章是从我的笔记直接转过来的,大家将就看吧。
下面两个地址很有参考价值:
语音识别:http://www.tuicool.com/articles/NRF3a2
语音合成:http://www.daxueit.com/article/4422.html
科大讯飞开放地址:http://www.xfyun.cn
闲着没事研究了一下手机语音功能,使用了科大讯飞...
分类:
其他好文 时间:
2015-05-27 10:19:36
阅读次数:
215
在过去50年,机器学习的研究已经从几个计算机工程师探索计算机是否能学会玩游戏的影响下不断成长,统计领域(在很大程度上忽视计算的考虑)到广泛的学科(该学科产生了基本的学习过程的统计-计算理论)已经设计了许多学习算法,这些算法通常应用在商业系统中,例如语音识别,计算机视觉,和其他各种各样的任务,并已剥离了数据挖掘中的工业来发掘网上不断增长的数据量中隐藏的规律。这篇文章提供了该学科(已经作为机器学习出现了...
分类:
其他好文 时间:
2015-05-27 10:16:18
阅读次数:
210
两者结合的案例比较少,不过还是可以用中间插件来做的。在unity 的资源商店里搜索kinect,然后搜索的结果会有免费的手势封装包,下载下来,里面会有详细的文档说明,还有自带的几个案例,骨骼追踪、手势识别都有。看看例子就会了。如果要做语音识别的,还得付费下载那个extra with ms-sdk,不过在游戏蛮牛这样的论坛上很轻松就能找到别人下载下来的,或者在我的百度网盘里下载也行。网址: http...
分类:
编程语言 时间:
2015-05-25 10:05:43
阅读次数:
227
本文主要采用matlab和C语言设计并实现了一个鲁棒性语音识别实验系统,通过该系统验证各种抗噪语音特征在不同信噪比的噪声环境下的识别率,并详细介绍了系统的结构以及开发工具与平台,最后介绍了系统的功能、实验流程以及该系统的实现。
系统演示下载路径:http://pan.baidu.com/s/1o61Kaa2
一、系统结构
本文研究的是非特定人鲁棒性语音识别,采用的是小...
分类:
其他好文 时间:
2015-05-24 18:57:12
阅读次数:
204