整合包介绍
IndexTTS2是B站语音团队开发的新型文本转语音(TTS)模型,已经正式开源。模型在情感表达和时长控制方面实现了重大突破,是首个支持精确时长控制的自回归TTS模型。支持零样本声音克隆,仅需一个音频文件即可精准复制音色、节奏和说话风格,支持多语言。IndexTTS2实现了情感音色分离控制,用户可以独立指定音色来源和情绪来源。模型具备多模态情感输入功能,支持通过情感参考音频、情感描述文本或情感向量来控制情感。
- 项目官网:https://index-tts.github.io/index-tts2.github.io/
- Github仓库:https://github.com/index-tts/index-tts
- HuggingFace模型库:https://huggingface.co/IndexTeam/IndexTTS-2
- arXiv技术论文:https://arxiv.org/pdf/2506.21619
我们提供的是B站UP
使用说明
将三个压缩包下载到同一个文件夹内,然后解压第一个压缩包,解压完之后双击AI音色克隆IndexTTS2.exe就可以启动。

© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END
暂无评论内容