话不多说,直接上代码运行截图

 1.语音合成

------->

执行:

python3实现语音转文字(语音识别)和文字转语音(语音合成)

结果:

python3实现语音转文字(语音识别)和文字转语音(语音合成)

输入要转换的内容,程序直接帮你把转换好的mp3文件输出(因为下一步–语音识别–需要.pcm格式的文件,程序自动执行格式转换,同时生成17k.pcm文件,暂时不用管,(你也可以通过修改默认参数改变文件输出的位置,名称及是否进行pcm转换
<-------

2.语音处理

---->
方便起见, 我们直接运行语音处理程序,识别我们上一步的17k.pcm文件:

python3实现语音转文字(语音识别)和文字转语音(语音合成)

What?识别居然出现了点错误,不过不用担心,博主已经调用过数百次了,总体效果还是能满足大部分需求的

<----

好了,代码已经演示过了,有需要的小伙伴可以到我的github直接拿,不用客气!

git地址:Github:maker_training_camp

最后提醒下:语音合成和识别 分别对应 chr_to_mp3.py 及 mp3_to_chr.py(哈哈,通过名字应该也能看出来)
注:windows运行程序可能不能输出17k.pcm文件(需要安装依赖)不过不影响声音合成,linux一切正常(同样是安装好依赖的情况下,依赖在代码中已体现)

华山资源网 Design By www.eoogi.com
广告合作:本站广告合作请联系QQ:858582 申请时备注:广告合作(否则不回)
免责声明:本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除!
华山资源网 Design By www.eoogi.com

RTX 5090要首发 性能要翻倍!三星展示GDDR7显存

三星在GTC上展示了专为下一代游戏GPU设计的GDDR7内存。

首次推出的GDDR7内存模块密度为16GB,每个模块容量为2GB。其速度预设为32 Gbps(PAM3),但也可以降至28 Gbps,以提高产量和初始阶段的整体性能和成本效益。

据三星表示,GDDR7内存的能效将提高20%,同时工作电压仅为1.1V,低于标准的1.2V。通过采用更新的封装材料和优化的电路设计,使得在高速运行时的发热量降低,GDDR7的热阻比GDDR6降低了70%。