一、关于HTML5语音Web Speech API HTML5中和Web Speech相关的API实际上有两类,一类是“语音识别(Speech Recognition)”,另外一个就是“语音合成(Speech Synthesis)”,这两个名词听上去很高大上,实际上指的分别是“语音转文字”,和“文字 ...
先前的文章《三个小白是如何在三个月内搭一个基于kaldi的嵌入式在线语音识别系统的 》说我们花了不到三个月的时间搭了一个基于kaldi的嵌入式语音识别系统,不过它是基于传统的GMM-HMM的,是给我们练手用的,通过搭这个系统我们累积了一定的语音识别领域的经验,接下来我们就要考虑做什么形态的产品了。语 ...
分类:
其他好文 时间:
2019-12-30 09:48:50
阅读次数:
266
最近因学习任务,对语音识别需要了解,所以现在就把一些学习过程遇到的问题解决方法分享给大家。首先pyhon提供了许多语音识别库,大致包含: 上述语音识别软件库各个之间的侧重点不同,如:谷歌云语音侧重语音向文本转换,又如wit与apiai还提供超出基本语音识别的内置功能(识别讲话者意图的自然语言处理功能 ...
分类:
编程语言 时间:
2019-12-24 12:04:12
阅读次数:
508
语音学三个分支: 1. 发音语音学 2. 声学语音学 进一步出现了声音模拟、语音合成、语音识别 3. 听觉语音学和心理语言学 研究人耳和大脑 本章介绍语音产生的过程及人耳的听觉过程,传统的线性语音产生模型以及目前广泛受到重视的非线性 语音产生模型,这些都是从事语音信号处理研究的基础知识。 2.1 语 ...
分类:
其他好文 时间:
2019-12-21 11:55:38
阅读次数:
100
人工智能旨在了解人类智能的本质,并创造出能模仿人类智能做出反应的智能机器,目前在一些领域已经取得显著的成功,如AI玩游戏、问答系统、自动驾驶、无人机、机器人、翻译、人脸识别、语音识别等领域。深度学习的突破性进展是人们对人工智能产生巨大兴趣的主要原因之一,它包含几个关键的技术:卷积神经网络、循环神经网 ...
分类:
其他好文 时间:
2019-12-17 13:05:17
阅读次数:
102
近几年来,兴起了一股人工智能热潮,让人们见到了AI的能力和强大,比如图像识别,语音识别,机器翻译,无人驾驶等等。总体来说,AI的门槛还是比较高,不仅要学会使用框架实现,更重要的是,需要有一定的数学基础,如线性代数,矩阵,微积分等。 幸庆的是,国内外许多大神都已经给我们造好“轮子”,我们可以直接来使用 ...
分类:
编程语言 时间:
2019-12-13 10:50:17
阅读次数:
117
python实现语音识别 我们用到是百度语音识别,因为不掏钱哈哈!首先去百度官网去创建你的 APPID AK SK 这个网上很多大家没创建的自己看下 目前本SDK的功能同REST API,需要联网调用http接口, 具体功能见REST API 文档, REST API 仅支持整段语音识别的模式,即需 ...
分类:
编程语言 时间:
2019-12-12 14:51:49
阅读次数:
153
眼下,RPA(机器人流程自动化)技术爆火于科技圈与投资界,并持续引发新一轮的数字化变革。与过去几年间的很多技术投资热点不同,如今RPA技术被资本方和市场方广为看好,原因有二:一是RPA经过产品形态的迭代,目前可以解决很多市场急迫待解决的需求;二是AI风口过后急需证明应用价值,RPA和AI天然的契合属性给AI扩展了更多应用方向。将AI更深入地应用于RPA,将会是今后一段时间内,RPA厂商都希望做到的
分类:
其他好文 时间:
2019-12-11 20:59:45
阅读次数:
112
电脑用汉字粤语拼音表随着语音识别技术的广泛应用,电脑粤语语音产品将有助长者和残障人士使用资讯科技。一套配合 ISO/IEC 10646 国际编码标准和《香港增补字符集》的粤语拼音参考表将有助加快产品开发的步伐。 《电脑用汉字粤语拼音表》提供了一套适用于香港的粤语拼音方案供市民参考,借此促进业界开发适 ...
分类:
其他好文 时间:
2019-11-30 15:20:19
阅读次数:
182
[toc] 本文提出了一个基于神经网络的语音识别系统List, Attend and Spell(LAS),能够将语音直接转录为文字。 进步性:LAS将声学、发音和语言模型融合为一个神经模型,因此可以实现端到端。LAS只包含两部分:收听器(listener)和拼写器(speller)。收听器是一个金 ...
分类:
Web程序 时间:
2019-11-26 23:08:46
阅读次数:
144