语音识别是计算机软件识别口语中的单词和短语,并将其转换为可读文本的能力。那么如何在 Python 中将语音转换为文本?如何使用 SpeechRecognition 库在 Python 中将语音转换为文本?我们不需要从头开始构建任何机器学习模型,该库为我们提供了各种著名的公共语音识别 API 的便捷包装。
使用 pip 安装库:
pip3 install SpeechRecognition
Okey,打开一个新的 Python 文件并导入它:
import speech_recognition as sr
从文件读取
确保当前目录中有一个包含英语语音的音频文件 (如果您想跟我一起学习,请在此处获取音频文件):
filename = “speech.wav”
该文件是从 LibriSpeech 数据集中获取的,但是您可以带上任何想要的东西,只需更改文件名,就可以初始化语音识别器:
# initialize the recognizer r = sr.Recognizer()
以下代码负责加载音频文件,并使用 Google Speech Recognition 将语音转换为文本:
# open the filewith sr.AudioFile(filename) as source:www.zpedu.com/ # listen for the data (load audio to memory) audio_data = r.record(source) # recognize (convert from speech to text) text = r.recognize_google(audio_data) print(text)
这需要几秒钟才能完成,因为它将文件上传到 Google 并获取了输出,这是我的结果:
I believe you're just talking nonsense
从麦克风读取
这需要在您的计算机中安装 PyAudio,以下是取决于您的操作系统的安装过程:
视窗
您可以点安装它:
pip3 install pyaudio
的 Linux
您需要首先安装依赖项:
sudo apt-get install python-pyaudio python3-pyaudio pip3 install pyaudio
苹果系统
您需要先安装 portaudio,然后才可以点安装它:
brew install portaudio pip3 install pyaudio
现在,让我们使用麦克风转换语音:
with sr.Microphone() as source: # read the audio data from the default microphone audio_data = r.record(source, duration=5) print(“Recognizing…”) # convert speech to text text = r.recognize_google(audio_data) print(text)
这会从您的麦克风听到 5 秒钟,然后尝试将该语音转换为文本!
它与先前的代码非常相似,但是我们在这里使用 Microphone () 对象从默认麦克风读取音频,然后在 record () 函数中使用 duration 参数在 5 秒后停止读取,然后上传音频数据向 Google 获取输出文本。
您还可以在 record () 函数中使用 offset 参数在偏移几秒钟后开始记录。
另外,您可以通过将语言参数传递给 accept_google () 函数来识别不同的语言。例如,如果您想识别西班牙语语音,则可以使用:
text = r.recognize_google(audio_data, language=”es-ES”)
总结
免责声明:本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除!
稳了!魔兽国服回归的3条重磅消息!官宣时间再确认!
昨天有一位朋友在大神群里分享,自己亚服账号被封号之后居然弹出了国服的封号信息对话框。
这里面让他访问的是一个国服的战网网址,com.cn和后面的zh都非常明白地表明这就是国服战网。
而他在复制这个网址并且进行登录之后,确实是网易的网址,也就是我们熟悉的停服之后国服发布的暴雪游戏产品运营到期开放退款的说明。这是一件比较奇怪的事情,因为以前都没有出现这样的情况,现在突然提示跳转到国服战网的网址,是不是说明了简体中文客户端已经开始进行更新了呢?
更新日志
- 齐秦《辉煌30年24K珍藏版》2CD[WAV+CUE]
- 证声音乐图书馆《海风摇曳·盛夏爵士曲》[FLAC/分轨][321.47MB]
- 群星 《世界经典汽车音乐》 [WAV分轨][1G]
- 冷漠.2011 《冷漠的爱DSD》[WAV+CUE][1.2G]
- 陈明《流金岁月精逊【中唱】【WAV+CUE】
- 群星《Jazz-Ladies1-2爵士女伶1-2》HQCD/2CD[原抓WAV+CUE]
- 群星《美女私房歌》(黑胶)[WAV分轨]
- 郑源.2009《试音天碟》24BIT-96KHZ[WAV+CUE][1.2G]
- 飞利浦试音碟 《环球群星监听录》SACD香港版[WAV+CUE][1.1G]
- 车载音乐最强享受《车载极致女声精选CD》[WAV分轨][1G]
- 童宇.2024-爱情万年历【TOUCH音乐】【FLAC分轨】
- 黄晓君.2010-丽风金典系列VOL.1.2CD【丽风】【WAV+CUE】
- 黄晓君.2011-丽风金典系列VOL.2【丽风】【WAV+CUE】
- 群星1992《天碟国语金曲精选》香港首版[WAV+CUE][1G]
- 萧敬腾《王妃》台湾首版[WAV分轨][1G]