写点什么

再升级!MoneyPrinterPlus 集成 GPT_SoVITS

作者:程序那些事
  • 2024-08-14
    广东
  • 本文字数:1452 字

    阅读完需:约 5 分钟

再升级!MoneyPrinterPlus集成GPT_SoVITS

最近有很多优秀的语音合成 TTS 工具,目前 MoneyPrinterPlus 已经集成了 ChatTTS 和 fasterWhisper。应朋友们的要求,最近 MoneyPrinterPlus 也集成了 GPT_SoVITS 这个优秀的语音合成工具。


今天给大家详细讲解一下,如何在 MoneyPrinterPlus 中使用 GPT_SoVITS。

软件准备

当然,前提条件就是你需要下载 MoneyPrinterPlus 软件啦。


下载地址: https://github.com/ddean2009/MoneyPrinterPlus


用得好的朋友,不妨给个 star 支持一下。 在软件 v4.4 版本之后,MoneyPrinterPlus 已经支持 GPT_SoVITS 本地 TTS 语音服务啦。

启动 GPT_SoVITS

GPT_SoVITS 这个工具怎么安装这里就不多讲了。


我们讲下如何跟 MoneyPrinterPlus 进行合作配置。


GPT_SoVITS 有很多功能,包括语音训练,模型微调,TTS 语音推理,变声等功能。


这里我们使用的是 GPT_SoVITS 的核心 TTS 语音推理功能。


首先我们启动 GPT_SoVITS:


在 1-GPT-SoVITS-TTS ---》 1C 推理 ---》 开启 TTS 推理 webUI



然后你就可以看到这样的 TTS 推理界面:



你可以选择参考音频,参考文本,参考音频的语言。


然后可以输入要合成的文本,合成语音的类别,语速,top_k, top_p 和 temperature。


当然,上面的都不重要,我们不需要通过 webUI 来调用 GPT_SoVITS,我们需要的是通过 API 来和 GPT_SoVITS 进行交互。

API 启动 GPT_SoVITS

如果下载的是 GPT_SoVITS 的集合包,那么可以直接执行下面的命令来启动 GPT_SoVITS 的 API:


启动api: runtime\python.exe api.py 
复制代码


启动之后,你会看到下面的内容:



上面的启动是最简单的启动,没有指定参考音频,如果你想指定参考音频的话,可以执行下面的命令:


python api.py -dr "123.wav" -dt "一二三。" -dl "zh" 
复制代码


当然,还有其他的一些启动参数如下:


`-dr` - `默认参考音频路径``-dt` - `默认参考音频文本``-dl` - `默认参考音频语种, "中文","英文","日文","韩文","粤语,"zh","en","ja","ko","yue"`
`-d` - `推理设备, "cuda","cpu"``-a` - `绑定地址, 默认"127.0.0.1"``-p` - `绑定端口, 默认9880, 可在 config.py 中指定``-fp` - `覆盖 config.py 使用全精度``-hp` - `覆盖 config.py 使用半精度``-sm` - `流式返回模式, 默认不启用, "close","c", "normal","n", "keepalive","k"`·-mt` - `返回的音频编码格式, 流式默认ogg, 非流式默认wav, "wav", "ogg", "aac"`·-cp` - `文本切分符号设定, 默认为空, 以",.,。"字符串的方式传入`
`-hb` - `cnhubert路径``-b` - `bert路径`
复制代码


大家可以根据需要自行选择。


默认情况下 API 会启动在 9880 端口,我们可以使用下面的命令来测试 API 的启动效果:


使用执行参数指定的参考音频:GET:    `http://127.0.0.1:9880?text=先帝创业未半而中道崩殂,今天下三分,益州疲弊,此诚危急存亡之秋也。&text_language=zh`POST:```json{    "text": "先帝创业未半而中道崩殂,今天下三分,益州疲弊,此诚危急存亡之秋也。",    "text_language": "zh"}```
复制代码

配置 MoneyPrinterPlus

好了,回到我们的 MoneyPrinterPlus 页面。


在基本配置页面,本地语音 TTS,我们选择 GPTSoVITS, 然后输入 GPTSoVITS 的地址。



在 AI 视频或者视频混剪区,在视频 TTS 语音合成区,我们选择本地服务。



这里列出来 GPTsoVITS 所需要的大部分参数。


你可以使用参考音频,参考音频文本,参考音频语音。


然后可以条件 temperature,top_P, top_K 等信息。



点击试听声音,如果你听到合成的声音,那么恭喜你,你的配置成功了。


同时,在 GPTsoVITS 服务的日志文件中,你可以看到一些语音合成的进度。


总结

GPTsoVITS 是一个非常强大的服务,和 MoneyPrinterPlus 结合起来使用,你将会无往不利。点我查看更多精彩内容:www.flydean.com

用户头像

关注公众号:程序那些事,更多精彩等着你! 2020-06-07 加入

最通俗的解读,最深刻的干货,最简洁的教程,众多你不知道的小技巧,尽在公众号:程序那些事!

评论

发布
暂无评论
再升级!MoneyPrinterPlus集成GPT_SoVITS_工具_程序那些事_InfoQ写作社区