首页 > 编程语言 > 详细

近期分享干货，使用python实现语音文件的特征提取方法

时间：2019-02-12 19:04:15 阅读：230 评论：0 收藏：0 [点我收藏+]

标签：使用 ffffff 格式结果 python 分享干货 col 天猫方向

Python编程语言无疑是人工智能最重要的语言之一，但是其中语音识别是当前人工智能比较热门的方向，百度的小度机器人、阿里的天猫精灵等其他各大公司都推出了各自的语音助手机器人，其识别算法主要是由RNN、LSTM、DNN-HMM等机器学习和深度学习技术做支撑。但训练这些模型的第一步就是将音频文件数据化，提取当中的语音特征。

MP3文件转化为WAV文件

录制音频文件的软件大多数都是以mp3格式输出的，但mp3格式文件对语音的压缩比例较重，因此首先利用ffmpeg将转化为wav原始文件有利于语音特征的提取。其转化代码如下：
技术图片
读取WAV语音文件，对语音进行采样

利用wave库对语音文件进行采样。

代码如下：
技术图片
绘制声波折线图与频谱图

代码如下：
技术图片
首先利用百度AI开发平台的语音合API生成的MP3文件进行上述过程的结果。

声波折线图
技术图片
频谱图

全部代码

以上这篇就是小编分享的使用python实现语音文件的特征提取方法。

近期分享干货，使用python实现语音文件的特征提取方法

标签：使用 ffffff 格式结果 python 分享干货 col 天猫方向

原文地址：http://blog.51cto.com/14167862/2349432

踩

(0)

赞

(0)

举报

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

更多

友情链接

兰亭集智国之画百度统计站长统计阿里云 chrome插件新版天听网

关于我们 - 联系我们 - 留言反馈

© 2014 mamicode.com 版权所有联系我们:gaon5@hotmail.com

迷上了代码！