Qwen3TTS声音克隆工作流

Qwen3TTS声音克隆工作流

工作流介绍

该工作流基于qwen tts大模型,可以根据输入的音色生成相匹配的音频,并且自定义台词。

模型下载

需要下载辅助模型的Qwen3-TTS-Models.zip文件,并且解压到ComfyUI\models根目录内,里面有三个模型。分别是:

  • Qwen3-TTS-12Hz-1.7B-base声音生成模型
  • Qwen3-TTS-12Hz-1.7B-CustomVoice声音模板模型
  • Qwen3-TTS-12Hz-1.7B-VoiceDesign声音设计模型

下载链接:ComfyUI工作流辅助模型-数字折叠

SOX安装

使用该工作流需要单独安装一个SOX软件,我们提供了完整包,解压就可以用,下载链接:

https://pan.baidu.com/s/18rUIFWts-qoKI_zxUghNcg?pwd=fold 提取码: fold

安装方法

1.将提供的压缩包解压到一个路径内,并记住这个路径

2.打开环境变量设置,在系统变量path里面写如软件的解压路径

3.cmd打开脚本编辑器,输入sox –version 检测是否安装成功。

使用方法

  1. 该工作流需要在DigitFold Studio软件里运行,下载链接:数字折叠本地AI创作工具DigitFold Studio-数字折叠,默认Studio工具里会包含该工作流,如果没有这通过下面下载按钮下载到Studio的workflows文件夹内。
  2. ComfyUI整合包需要大于等于v18.2,整合包链接(满足版本则忽略):数字折叠Comfyui整合包(适配DigitFold Studio工具)-数字折叠
  3. 你只需要将模型放置到下载页指定的comfyui路径内,名称需要保持一致,如果有修改务必在工作流高级设置里重新选择。
  4. 台词设计是输入要说的话,参考音色台词是写入你参考音频的的说的话的文字,必须要一样。保存设置必须是aa/bb的格式。
Image
Qwen3TTS声音克隆工作流
此内容为付费资源,请付费后查看
会员专属资源
您暂无购买权限,请先开通会员
支持远程部署
支持需求定制
工作流类型音频克隆
底膜QwenTTS
工具使用问题请联系微信 15915765126
付费资源
© 版权声明
THE END
喜欢就支持一下吧
点赞11 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容