使用SpeechRecognition进行语音识别

时间：2020-06-21 19:51:38 阅读：211 评论：0 收藏：0 [点我收藏+]

标签：中文 col tsp type baidu dev bin 配置 python

操作系统： CentOS7.7.1908_x64

gcc版本：4.8.5

Python 版本 : 3.6.8

安装语音识别环境：

virtualenv -p /usr/bin/python3 py36asr
source py36asr/bin/activate
pip install SpeechRecognition
yum install python3-devel
yum install pulseaudio-libs-devel
yum install alsa-lib-devel
pip install  PocketSphinx

配置中文语音识别数据：

下载地址：

https://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/

选择： Mandarin->cmusphinx-zh-cn-5.2.tar.gz

配置数据：

cd py36asr/lib/python3.6/site-packages/speech_recognition/pocketsphinx-data/
tar zxvf cmusphinx-zh-cn-5.2.tar.gz
mv cmusphinx-zh-cn-5.2 zh-cn
cd zh-cn
mv zh_cn.cd_cont_5000 acoustic-model
mv zh_cn.lm.bin language-model.lm.bin
mv zh_cn.dic pronounciation-dictionary.dict

测试文本：

自然语言理解和生成是一个多方面问题，我们对它可能也只是部分理解。

语音识别示例：

(py36asr) [root@host60 pyasrTest1]# ls
test1.py  test1.wav
(py36asr) [root@host60 pyasrTest1]# cat test1.py
# -*- coding: utf-8 -*-
# /usr/bin/python

import speech_recognition as sr
r = sr.Recognizer()
test = sr.AudioFile("test1.wav")
with test as source:
    audio = r.record(source)
type(audio)
c=r.recognize_sphinx(audio, language=‘zh-cn‘)
print(c)
(py36asr) [root@host60 pyasrTest1]# python test1.py
自然 语言 李杰 和 申城 是一 个 多方 面 问题 我们 对 他 可能 也 只是 部分 礼节
(py36asr) [root@host60 pyasrTest1]#

技术图片

本文涉及资源下载地址：https://pan.baidu.com/s/1Out0tJlb_Qs-2C06_2YHOQ

可关注微信公众号（聊聊博文）后回复 2020062101 获取提取码。

本文github地址：

https://github.com/mike-zhang/mikeBlogEssays/blob/master/2020/20200621_使用SpeechRecognition进行语音识别.rst

使用SpeechRecognition进行语音识别

标签：中文 col tsp type baidu dev bin 配置 python

原文地址：https://www.cnblogs.com/MikeZhang/p/pyAsr20200621.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行