VoxCPM2声音生成工作流

工作流介绍

VoxCPM2是面壁智能联合清华大学人机语音交互实验室一起推出的最新一代的语音大模型,一经发布,其在Github上就获得了将近7万的star;其支持生成30+种语言、8种中国方言,支持48kHz采样率。

VoxCPM2支持的功能亮点总结如下:

  1. 支持中英日韩法德俄阿拉伯语等30+种语言,覆盖了东南亚八国语言(越南语、泰语、印尼语、老挝语、缅甸语、柬埔寨语、菲律宾语、马来西亚语。)
  2. 支持9种中国方言(四川话、粤语、吴语、东北话、河南话、陕西话、山东话、天津话、闽南语。)
  3. 可以直接通过文字制造声音:你可以直接用文字描述来创造一个全新的、之前根本不存在的声音。
  4. 克隆你的声音,还能复刻情感:上传一段你的声音,它能提取你的音色,并生成你指定的任意文本,而且可以根据你的要求改变情绪和语速
  5. 48kHz 高保真,配音级表现力

我们目前提供了VoxCPM2的声音设计和声音克隆工作流,适配DFCine画布软件。

模型配置

在我们的模型库中下载voxcpm文件夹,放到\ComfyUI\models 根目录内。

下载链接:https://www.digitfold.com/5075.html

Image
© 版权声明
THE END
喜欢就支持一下吧
点赞5 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容