Qwen3TTS声音克隆工作流-数字折叠

Qwen3TTS声音克隆工作流

Qwen3TTS声音克隆工作流

025011

2个月前更新

工作流介绍

该工作流基于qwen tts大模型，可以根据输入的音色生成相匹配的音频，并且自定义台词。

使用教程

模型下载

需要下载辅助模型的Qwen3-TTS-Models.zip文件，并且解压到ComfyUI\models根目录内，里面有三个模型。分别是：

Qwen3-TTS-12Hz-1.7B-base声音生成模型
Qwen3-TTS-12Hz-1.7B-CustomVoice声音模板模型
Qwen3-TTS-12Hz-1.7B-VoiceDesign声音设计模型

下载链接：ComfyUI工作流辅助模型-数字折叠

SOX安装

使用该工作流需要单独安装一个SOX软件，我们提供了完整包，解压就可以用，下载链接：

https://pan.baidu.com/s/18rUIFWts-qoKI_zxUghNcg?pwd=fold 提取码: fold

安装方法

1.将提供的压缩包解压到一个路径内，并记住这个路径

2.打开环境变量设置，在系统变量path里面写如软件的解压路径

3.cmd打开脚本编辑器，输入sox –version 检测是否安装成功。

使用方法

该工作流需要在DigitFold Studio软件里运行，下载链接:数字折叠本地AI创作工具DigitFold Studio-数字折叠，默认Studio工具里会包含该工作流，如果没有这通过下面下载按钮下载到Studio的workflows文件夹内。
ComfyUI整合包需要大于等于v18.2，整合包链接（满足版本则忽略）：数字折叠Comfyui整合包（适配DigitFold Studio工具）-数字折叠
你只需要将模型放置到下载页指定的comfyui路径内，名称需要保持一致，如果有修改务必在工作流高级设置里重新选择。
台词设计是输入要说的话，参考音色台词是写入你参考音频的的说的话的文字，必须要一样。保存设置必须是aa/bb的格式。

© 版权声明

文章版权归作者所有，未经允许请勿转载。

THE END

工作流
# 声音ai

喜欢就支持一下吧

相关推荐

评论抢沙发

请登录后发表评论

暂无评论内容