写点什么

在 MoneyPrinterPlus 中使用本地 chatTTS 语音模型

作者:程序那些事
  • 2024-07-16
    广东
  • 本文字数:1385 字

    阅读完需:约 5 分钟

在MoneyPrinterPlus中使用本地chatTTS语音模型

之前 MoneyPrinterPlus 在批量混剪,一键 AI 生成视频这些功能上的语音合成功能都用的是云厂商的语音服务,比阿里云,腾讯云和微软云。


云厂商虽然提供了优质的语音服务,但是用起来还是要收费。


为了各位小伙伴的钱包,现在特意给 MoneyPrinterPlus 上线了本地 chatTTS 语音服务。


赶紧来体验吧。

软件准备

当然,前提条件就是你需要下载 MoneyPrinterPlus 软件啦。


下载地址: https://github.com/ddean2009/MoneyPrinterPlus


用得好的朋友,不妨给个 star 支持一下。 在软件 v4.0 版本之后,MoneyPrinterPlus 已经全面开始支持本地模型。

安装 chatTTS

我们可以直接从 chatTTS 的官网上 https://github.com/2noise/ChatTTS 下载 chatTTS 的源代码:


git clone https://github.com/2noise/ChatTTScd ChatTTS
复制代码


安装依赖:


pip install --upgrade -r requirements.txt
复制代码


运行 web-UI:


python examples/web/webui.py
复制代码


运行 api-server:


fastapi dev examples/api/main.py --host 0.0.0.0 --port 8000
复制代码


这里注意,web-ui 的默认端口是 8080, api-server 的端口是 8000。


MoneyPrinterPlus 需要连接的是 8000 端口的 api-server。


web-UI 只是为了展示怎么配置音色的一个展示用的。


我们打开 http://localhost:8080/ 可以看到类似下面的页面:



点击生成按钮,如果能够成功合成音频文件,那么说明你的 chatTTS 安装成功了。

在 MoneyPrinterPlus 中使用 ChatTTS

回到 MoneyPrinterPlus,我们启动 MoneyPrinterPlus,在基本配置页面我们可以看到:本地语音 TTS 的选项。



这里我们选择 chatTTS,并且设置 chatTTS api server 的地址。


上面我们是以 8000 启动的 api server,所以这里我们就输入:http://127.0.0.1:8000/


接下来点击视频混剪区,在视频配音区选择本地模型:



我们可以得到下面的界面:



解释一下各个参数的作用:


是否口语化对应 chatTTS 的口语化开关,如果启动口语化,chatTTS 会自动对输入的文案进行口语化调整。所以默认是不开启的。


Text Seed 是控制口语化模型处理的种子,你可以随意调整。


Audio Temperature 控制音频情感波动性,范围为 0-1,数字越大,波动性越大


top_P :控制音频的情感相关性,范围为 0.1-0.9,数字越大,相关性越高


top_K :控制音频的情感相似性,范围为 1-20,数字越小,相似性越高


Refine text Prompt 是指在口语化过程中添加的一些参数。如果不懂的话可以不修改。


本地 chatTTS 音色目录,默认在项目的 chattts 目录中。


现在我在 chattts 目录中预先放置了 2 种音色文件。


一种是 txt 文件,一种是 pt 文件。


你可以自行添加更多的音色文件到 chattts 目录中。


那么有小伙伴要问了,txt 或者 pt 文件是怎么来的呢?


先讲一个简单的 pt 文件,你可以在 https://modelscope.cn/studios/ttwwwaa/ChatTTS_Speaker 这个空间中试听和下载对应的语音文件:



把下载下来的 pt 文件,放在 MoneyPrinterPlus 中的 chattts 目录即可。


txt 文件是怎么来的呢?


我们再次回到 chatTTS 的 webUI 界面:



这个 txt 就是这里的 Speaker Embedding 的内容。


你可以点击右上角的拷贝按钮,新建一个 utf-8 编码的 txt 文件。 把这个 txt 文件放到 MoneyPrinterPlus 中的 chattts 目录即可。


如果你不想用已有的音色文件,那么可以点击使用随机声音按钮:



会出现一个 Audio Seed 选项,这个 seed 就是用来控制 Audio 音色的。


有了这些配置之后,点击试听声音,如果能听到声音就说明你的 chatTTS 在 MoneyPrinterPlus 中配置成功了。


接下来就可以使用本地的 chatTTS 来合成语音啦。


点我查看更多精彩内容:www.flydean.com

发布于: 刚刚阅读数: 3
用户头像

关注公众号:程序那些事,更多精彩等着你! 2020-06-07 加入

最通俗的解读,最深刻的干货,最简洁的教程,众多你不知道的小技巧,尽在公众号:程序那些事!

评论

发布
暂无评论
在MoneyPrinterPlus中使用本地chatTTS语音模型_工具_程序那些事_InfoQ写作社区