Google版的Siri迎来了一位新“爸爸”,这位年仅21岁的年轻人曾是Facebook史上最年轻的工程师,如今他将帮助Google的语音助手在体验上同Siri正面竞争,后者的负责人则是一位年近50的苹果高管。 Google Assistant 从一个名不见经传的无名小辈到世界顶级AI团队的产品经理 ...
分类:
其他好文 时间:
2017-09-15 20:57:46
阅读次数:
198
TIMIT语音库是IT和MIT合作音素级别标注的语音库,用于自动语音识别系统的发展和评估,包括来自美式英语,8个地区方言,630个人。 每个人读10个句子,每个发音都是音素级别、词级别文本标注,16kHz,16bit。 注意:不用使用TIMIT配置作为运行Kaldi的一个通用型例子,因为它不是一个非 ...
分类:
其他好文 时间:
2017-09-15 13:42:57
阅读次数:
285
原文链接地址:http://blog.csdn.net/u010451580/article/details/51178190 一.语音的产生简介 1.1 发音器官 人体的语音是由人体的发音器官在大脑的控制下做生理运动产生的。人体发音器官由三部分组成:肺和气管、喉、声道。 肺是语音产生的能源所在。气 ...
分类:
其他好文 时间:
2017-09-07 17:00:30
阅读次数:
234
1、SIP业务基本知识 1.1 业务介绍会话初始协议(Session Initiation Protocol)是一种信令协议,用于初始、管理和终止网络中的语音和视频会话,具体地说就是用来生成、修改和终结一个或多个参与者之间的会话。SIP的业务模式是一个点对点协议,其中有两个要素——SIP用户代理和S ...
分类:
其他好文 时间:
2017-09-06 19:39:26
阅读次数:
222
文字转语音最好的办法当然是找个声优,完美的搞起。 不过显然很多时候需要很多时间,当在对语音要求并不高的时候自然也就有了投机取巧的方法。 工具: win7或win10自带的录音机。 原理及步骤: 1.将需要的语音编辑好文档。 2.将文档放在百度翻译一类的翻译软件上,点击发音按钮就可以听到不错的语音效果 ...
分类:
其他好文 时间:
2017-09-05 13:59:18
阅读次数:
156
1、前言 要在语音视频 SDK 中实现超低延迟,实时的语音视频传输机制是必不可少的,而 FEC 和 ARQ 的智能结合是实时语音视频传输机制的基石。在语音社交、视频社交、游戏语音和互动直播等领域,关于在语音视频实时传输中实现低延迟这个议题,已经有不少的文章提出各种方案。绝大部分方案的思路都是“优化” ...
分类:
其他好文 时间:
2017-09-01 23:09:51
阅读次数:
318
语音识别(SR)功能是当今国外操作系统的标准特征,而国产操作系统根本不具备这样的特质,并且国家队没有相关的主观动力。去开发实际可用的语音识别系统。与国外相比,国产操作系统落后了一大节子,怪谁? 如何让机器识别人的语音?事实上大道理并不复杂。首先,让机器设备听懂元音,然后听懂辅音。将两者合成起来成为单 ...
分类:
其他好文 时间:
2017-08-20 12:31:43
阅读次数:
117
语音聊天室,或多人语音聊天,是即时通信应用中常见的功能之一,比如,QQ的语音讨论组就是我们用得比较多的。 这篇文章将实现一个简单的语音聊天室,让多个人可以进入同一个房间进行语音沟通。先看运行效果截图: 从左到右的三张图分别是:登录界面、语音聊天室的主界面、标注了各个控件的主界面。 (如果觉得界面太丑 ...
分类:
其他好文 时间:
2017-08-03 13:45:34
阅读次数:
119
今天是异地恋第28天,这几天我们重新沉浸在爱情的甜蜜中,我也忘记了之前种种的不愉快。给你买的泰迪熊到了,这是我第一次给女生买毛绒玩具,你好像也很喜欢。不过,晚上的语音内容相比以往氛围有点凝重,我们探讨了未来,说真的未来对我来说不可怕,我一直很自信,觉得尽在自己的掌握中,可是至少目前我还是一无所有,我 ...
分类:
其他好文 时间:
2017-07-23 00:49:05
阅读次数:
141
本文系原创,禁止转载。 分享如何使用c#对接科大讯飞语音听写服务,简单高效地实现语音听写。 实现语音听写主要分为录音和语音识别两部分;录音是指获取设备声卡端口的音频数据并将之保存为音频文件,语音识别就是将刚才所述的音频文件通过调用讯飞的语音听写服务转换为文字。 相关的类库文件 1. 开源录音库 NA ...