VoxCPM2声音生成工作流-数字折叠

工作流介绍

VoxCPM2是面壁智能联合清华大学人机语音交互实验室一起推出的最新一代的语音大模型，一经发布，其在Github上就获得了将近7万的star；其支持生成30+种语言、8种中国方言，支持48kHz采样率。

VoxCPM2支持的功能亮点总结如下：

我们目前提供了VoxCPM2的声音设计和声音克隆工作流，适配DFCine画布软件。

在我们的模型库中下载voxcpm文件夹，放到\ComfyUI\models 根目录内。

1.安装数字折叠Comfyui整合包和DFCine画布，并且将模型下载到指定位置

2.声音设计工作流只需要连接一个文本节点，输入你的音色设计提示词，在节点上输入台词

3.声音克隆工作流需要有三个输入。分别是：需要克隆的声音文件，声音设计文本（控制声音的情绪方言），以及声音文件的台词（要手动打出来，一模一样），台词需要在工作流提示词里写入。

文章版权归作者所有，未经允许请勿转载。

THE END