码迷,mamicode.com
首页 > 其他好文 > 详细

人工智能-语音合成-语音识别

时间:2018-05-18 21:19:29      阅读:541      评论:0      收藏:0      [点我收藏+]

标签:onclick   opened   hid   pen   开发   display   录音   inf   result   

 

 

图灵机器人:

http://www.tuling123.com

 

百度开发平台:

http://ai.baidu.com/

 

下载

baidu-api

如果已安装pip,执行pip install baidu-aip即可。技术分享图片

 

 

 

ffmpeg  先下载文件,再配置到系统路径

技术分享图片

技术分享图片

技术分享图片

下载完安装包,解压后,将该绝对路径 配置到系统路径。

技术分享图片

 

配置成功如下:

技术分享图片

 

 

打开电脑的录音机。

 技术分享图片

 

jieba中文分词 

 

技术分享图片

 

 

技术分享图片
技术分享图片

 1.

技术分享图片

 

2.创建应用

 技术分享图片

 

 

3.自动生成

技术分享图片

 

4.

技术分享图片

语音合成

1.

技术分享图片

2.复制代码到一个新的py文件中。

技术分享图片

 

技术分享图片

 

3.右键运行,即可将文字转成语音。

技术分享图片

 

代码:

 

技术分享图片
# 语言合成  文字 ->语音

from aip import AipSpeech

""" 你的 APPID AK SK """
APP_ID = 11262331
API_KEY = Weu6QCLgU8oCPvULqpOSer7c
SECRET_KEY = wMThGsaL8NPdNgE6z4A3Rmes1DvWNBO1

client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)


result  = client.synthesis(你好呀,我的贝贝, zh, 1, {
    vol: 5,
    spd: 6,
    pit: 3,
    vol: 9,
    per: 4
})

# 识别正确返回语音二进制 错误则返回dict 参照下面错误码
if not isinstance(result, dict):
    with open(贝贝.mp3, wb) as f:
        f.write(result)
语音合成

 

 

 

 

 

语音识别

1.SDK文档

技术分享图片

 

 

2.复制代码到一个新的py文件中。

技术分享图片

技术分享图片

3.代码:

 

技术分享图片
import os

cmd = "ffmpeg -y -i %s -acodec pcm_s16le -f s16le -ac 1 -ar 16000 %s"%("贝贝.mp3","贝贝.pcm")

os.system(cmd)
pcm

 

技术分享图片

 

 

4.在cmd中先运行该文件,转换语音的格式为pcm格式。

技术分享图片

 

5.右键运行即可

技术分享图片

 

 

 

人工智能-语音合成-语音识别

标签:onclick   opened   hid   pen   开发   display   录音   inf   result   

原文地址:https://www.cnblogs.com/c-x-m/p/9057916.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!