IndexTTS2音色克隆整合包

IndexTTS2音色克隆整合包

整合包介绍

IndexTTS2是B站语音团队开发的新型文本转语音(TTS)模型,已经正式开源。模型在情感表达和时长控制方面实现了重大突破,是首个支持精确时长控制的自回归TTS模型。支持零样本声音克隆,仅需一个音频文件即可精准复制音色、节奏和说话风格,支持多语言。IndexTTS2实现了情感音色分离控制,用户可以独立指定音色来源和情绪来源。模型具备多模态情感输入功能,支持通过情感参考音频、情感描述文本或情感向量来控制情感。

  • 项目官网:https://index-tts.github.io/index-tts2.github.io/
  • Github仓库:https://github.com/index-tts/index-tts
  • HuggingFace模型库:https://huggingface.co/IndexTeam/IndexTTS-2
  • arXiv技术论文:https://arxiv.org/pdf/2506.21619

我们提供的是B站UP 与AI同行 制作的整合包百度网盘下载链接。

使用说明

将三个压缩包下载到同一个文件夹内,然后解压第一个压缩包,解压完之后双击AI音色克隆IndexTTS2.exe就可以启动。

Image
IndexTTS2音色克隆整合包
此内容为免费资源,请登录后查看
0
提供远程协助
支持需求定制
功能声音生成
语言
大小11GB
工具使用问题请联系微信 15915765126
免费资源
© 版权声明
THE END
喜欢就支持一下吧
点赞5 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容