falsk 基础语音识别与语音合成（）

时间：2018-10-17 00:14:37 阅读：195 评论：0 收藏：0 [点我收藏+]

标签：int pat image 文件 div demo mpeg orm 应用

首先搜索http://ai.baidu.com/进入官网。

技术分享图片

下拉找到百度语音：

技术分享图片

然后创建一个语音应用：

管理应用之后：

技术分享图片

语音合成：

然后新建一个py文件：

from aip import AipSpeech

APP_ID = ‘14454183‘
API_KEY = ‘txNuGCIsenvEB93I70EsWwB4‘
SECRET_KEY = ‘dzdok3DcUeUxE28atFgiOQzxVd91BmQu‘

client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
res = client.synthesis(‘我如果爱你‘,options={
    "vol":8,
    "pit":8,
    "spd":5,
    "per":4
})
with open("audio.mp3",‘wb‘)as f:
    f.write(res)

语音识别：

在本地保存一个音频文件，新建一个py文件：

from aip import AipSpeech
import os

APP_ID = ‘14454183‘
API_KEY = ‘txNuGCIsenvEB93I70EsWwB4‘
SECRET_KEY = ‘dzdok3DcUeUxE28atFgiOQzxVd91BmQu‘

client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
def get_file_content(filePath):
    ‘‘‘
    因为只能识别pcm格式的音频，所以利用ffmpeg将mp3格式转化成pcm格式
    ‘‘‘
    cmd_str = "ffmpeg -y -i {0} -acodec pcm_s16le -f s16le -ac 1 -ar 16000 {0}.pcm".format(filePath)
    os.system(cmd_str)
    with open("%s.pcm"%(filePath), ‘rb‘) as f:
        return f.read()
res = client.asr(speech=get_file_content("audio.mp3"),options={
    "dev_pid":1536,
})
print(res)

要记得将ffpeg中的bin目录放在系统的环境变量里，然后重启pycharn。

然后我们写一个demo：

falsk 基础语音识别与语音合成（）

标签：int pat image 文件 div demo mpeg orm 应用

原文地址：https://www.cnblogs.com/yb635238477/p/9800922.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

falsk 基础 语音识别与语音合成（）

falsk 基础语音识别与语音合成（）