模型介绍
VACE 14B 是阿里通义万相团队推出的开源视频编辑统一模型。该模型通过整合多任务能力、支持高分辨率处理及灵活的多模态输入机制,显著提升了视频创作的效率与质量。
该模型基于 Apache-2.0 协议开源,可用于个人商业用途。
以下是其核心特性与技术亮点的综合分析:
- 多模态输入:支持文本、图像、视频、遮罩、控制信号等多种输入形式
- 统一架构:单一模型支持多种任务,可自由组合功能
- 动作迁移:基于参考视频生成连贯动作
- 局部替换:通过遮罩替换视频中的特定区域
- 视频扩展:补全动作或扩展背景
- 背景替换:保留主体更换环境背景
目前 VACE 发布了 1.3B 和 14B 两个版本,14B 版本相比 1.3B 版本,支持 720P 分辨率输出,画面细节和稳定性更好。
使用方法
- 将模型下载到Comfyui安装目录的models\diffusion_models目录下
- 模型所需的VAE texte_encoders模型需要到以下链接下载:万相文生视频1.4b模型Wan2_1-T2V-14B_fp8_e4m3fn-数字折叠

© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END
暂无评论内容