工作流介绍
VoxCPM2是面壁智能联合清华大学人机语音交互实验室一起推出的最新一代的语音大模型,一经发布,其在Github上就获得了将近7万的star;其支持生成30+种语言、8种中国方言,支持48kHz采样率。
VoxCPM2支持的功能亮点总结如下:
- 支持中英日韩法德俄阿拉伯语等30+种语言,覆盖了东南亚八国语言(越南语、泰语、印尼语、老挝语、缅甸语、柬埔寨语、菲律宾语、马来西亚语。)
- 支持9种中国方言(四川话、粤语、吴语、东北话、河南话、陕西话、山东话、天津话、闽南语。)
- 可以直接通过文字制造声音:你可以直接用文字描述来创造一个全新的、之前根本不存在的声音。
- 克隆你的声音,还能复刻情感:上传一段你的声音,它能提取你的音色,并生成你指定的任意文本,而且可以根据你的要求改变情绪和语速
- 48kHz 高保真,配音级表现力
我们目前提供了VoxCPM2的声音设计和声音克隆工作流,适配DFCine画布软件。
使用教程
模型配置
在我们的模型库中下载voxcpm文件夹,放到\ComfyUI\models 根目录内。
下载链接:https://www.digitfold.com/5075.html
提示词参考
- 声音设计:VoxCPM音色设计提示词-数字折叠
- 声音克隆:VoxCPM音色克隆情绪提示词-数字折叠
使用方法
1.安装数字折叠Comfyui整合包和DFCine画布,并且将模型下载到指定位置
2.声音设计工作流只需要连接一个文本节点,输入你的音色设计提示词,在节点上输入台词
3.声音克隆工作流需要有三个输入。分别是:需要克隆的声音文件,声音设计文本(控制声音的情绪方言),以及声音文件的台词(要手动打出来,一模一样),台词需要在工作流提示词里写入。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END



















暂无评论内容