原文摘要:深度学习可以让那些拥有多个处理层的计算模型来学习具有多层次抽象的数据的表示。这些方法在很多方面都带来了显著的改善,包含最先进的语音识别、视觉对象识别、对象检測和很多其他领域,比如药物发现和基因组学等。深度学习可以发现大数据中的复杂结构。它是利用BP算法来完毕这个发现过程的。BP算法可以指导 ...
分类:
其他好文 时间:
2017-05-16 20:45:54
阅读次数:
458
本文第一部分先解释AR谱,但并不会给出太多的细节,第二部分介绍几种常见的语音中的特征。有些在之前的博文中已经用过。诸如过零率。第三部分给出实际操作的过程及识别的效果。本文的目标是通过对DSP採集的声音信号提取特征,识别卡车和飞机。转载请注明出处: xiahouzuoxin.github.io关于AR ...
分类:
其他好文 时间:
2017-05-14 21:47:01
阅读次数:
270
怎样计算使用某种codec所消耗的带宽呢?在默认情况下,把模拟话音转换为数字话音后,依据不同codec的ptime值将语音进行打包,即RTP封装起来。应用UDP协议将本段採集的语音信息发送到被叫方。 比如:G.711编码,并在Internet上传输。我们来算下一路G.711路话音须要多大带宽。G.7 ...
分类:
其他好文 时间:
2017-05-11 19:45:19
阅读次数:
247
我第一次被安利用微信是因为当时他的语音功能,然后感觉推送方便,界面也很轻,可能是上了年纪耍不动花里胡哨的东西了。 凡是有但是,但是现在感觉又重了,不仅功能重了,人情也重了, 其中一个引人讨厌的就是微信投票, 至少我不喜欢,特别是为了赢个水杯,天天群里推投票之类的!!! 于是我就想帮他刷票, 帮他的对 ...
分类:
微信 时间:
2017-05-11 11:34:34
阅读次数:
291
原文标题:AR化妆镜?而且还能语音识别? 专业的美容和医疗公司ModiFace和语音识别厂商SoundHound达成合作,双方将联手开发最终的智慧镜软件。把SoundHound的语音支持AI平台Houndify集成至ModiFace的AR智慧镜软件中,用户能通过语音和真人视频来与这块“魔镜”使用。 ...
分类:
其他好文 时间:
2017-05-05 14:21:46
阅读次数:
135
iLBC(internet lowbitrate codec):是全球著名语音引擎提供商Global IP Sound开发,它是低比特率的编码解码器,提供在丢包时具有的强大的健壮性。iLBC 提供的语音音质等同于或超过 G.729 和 G.723.1,并比其他低比特率的编码解码器更能阻止丢包。iLB ...
分类:
其他好文 时间:
2017-04-30 22:58:04
阅读次数:
227
【更新】有人说不会使用科大讯飞的语音包。这里是传送门,能够參考从零系列的前四篇文章 (一)利用科大讯飞语音包实现Android语音识别Demo (二)科大讯飞语音包Mscdemo的使用 (三)自己定义类中调用讯飞语音包错误解决的方法 (四)运用Handler另起线程执行科大讯飞语音识别 本文主要介绍 ...
分类:
其他好文 时间:
2017-04-24 13:20:18
阅读次数:
202
1. 下载并使用,描述最简单直观的个人第一次上手体验。 我个人也用过很多的语音助手,比如苹果上的Siri、还有安卓的讯飞语音,个人感觉微软小娜最好用。因为微软小娜在各种方面都很人性化,说话也会带着语气没有那种机器人的感觉,功能也很多比如能玩成语接龙之类的游戏很有意思。 2. 按照《构建之法》13.1 ...
分类:
移动开发 时间:
2017-04-04 20:34:21
阅读次数:
246
在前面我们讲到了DNN,以及DNN的特例CNN的模型和前向反向传播算法,这些算法都是前向反馈的,模型的输出和模型本身没有关联关系。今天我们就讨论另一类输出和模型间有反馈的神经网络:循环神经网络(Recurrent Neural Networks ,以下简称RNN),它广泛的用于自然语言处理中的语音识 ...
分类:
编程语言 时间:
2017-03-06 21:05:08
阅读次数:
355
大多数人接触“语义”都是在和文字相关的领域,或语音识别,期望机器能够识别你发出去的消息或简短的语音,然后给予你适当的反馈和回复。嗯,看到这里你应该已经猜到了,图像领域也是存在“语义”的。 今天是AI大热年,很多人都关注与机器人的语音交互,可是有没有想过,将来的机器人如果不能通过图像来识别主人,家里的 ...
分类:
其他好文 时间:
2017-02-17 14:44:20
阅读次数:
564