工作流介绍
该工作流基于qwen tts大模型,可以根据输入的音色生成相匹配的音频,并且自定义台词。
模型下载
需要下载辅助模型的Qwen3-TTS-Models.zip文件,并且解压到ComfyUI\models根目录内,里面有三个模型。分别是:
- Qwen3-TTS-12Hz-1.7B-base声音生成模型
- Qwen3-TTS-12Hz-1.7B-CustomVoice声音模板模型
- Qwen3-TTS-12Hz-1.7B-VoiceDesign声音设计模型
下载链接:ComfyUI工作流辅助模型-数字折叠
SOX安装
使用该工作流需要单独安装一个SOX软件,我们提供了完整包,解压就可以用,下载链接:
https://pan.baidu.com/s/18rUIFWts-qoKI_zxUghNcg?pwd=fold 提取码: fold
安装方法
1.将提供的压缩包解压到一个路径内,并记住这个路径
2.打开环境变量设置,在系统变量path里面写如软件的解压路径
3.cmd打开脚本编辑器,输入sox –version 检测是否安装成功。
使用方法
- 该工作流需要在DigitFold Studio软件里运行,下载链接:数字折叠本地AI创作工具DigitFold Studio-数字折叠,默认Studio工具里会包含该工作流,如果没有这通过下面下载按钮下载到Studio的workflows文件夹内。
- ComfyUI整合包需要大于等于v18.2,整合包链接(满足版本则忽略):数字折叠Comfyui整合包(适配DigitFold Studio工具)-数字折叠
- 你只需要将模型放置到下载页指定的comfyui路径内,名称需要保持一致,如果有修改务必在工作流高级设置里重新选择。
- 台词设计是输入要说的话,参考音色台词是写入你参考音频的的说的话的文字,必须要一样。保存设置必须是aa/bb的格式。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END




















暂无评论内容