Wan多模态控制模型Wan2_1-VACE_module_14B_fp8_e4m3fn-数字折叠

Wan多模态控制模型Wan2_1-VACE_module_14B_fp8_e4m3fn

Wan多模态控制模型Wan2_1-VACE_module_14B_fp8_e4m3fn

016397

1年前更新

模型介绍

VACE 14B 是阿里通义万相团队推出的开源视频编辑统一模型。该模型通过整合多任务能力、支持高分辨率处理及灵活的多模态输入机制，显著提升了视频创作的效率与质量。

该模型基于 Apache-2.0 协议开源，可用于个人商业用途。

以下是其核心特性与技术亮点的综合分析：

多模态输入:支持文本、图像、视频、遮罩、控制信号等多种输入形式
统一架构:单一模型支持多种任务,可自由组合功能
动作迁移:基于参考视频生成连贯动作
局部替换:通过遮罩替换视频中的特定区域
视频扩展:补全动作或扩展背景
背景替换:保留主体更换环境背景

目前 VACE 发布了 1.3B 和 14B 两个版本，14B 版本相比 1.3B 版本，支持 720P 分辨率输出,画面细节和稳定性更好。

使用方法

将模型下载到Comfyui安装目录的models\diffusion_models目录下
模型所需的VAE texte_encoders模型需要到以下链接下载：万相文生视频1.4b模型Wan2_1-T2V-14B_fp8_e4m3fn-数字折叠

© 版权声明

文章版权归作者所有，未经允许请勿转载。

THE END

AI工具
# WanVideo

喜欢就支持一下吧

相关推荐

评论抢沙发

请登录后发表评论

暂无评论内容