LTX2.3图生视频音画同出高清版

工作流介绍

该工作流基于ltx2.3 蒸馏版1.1大模型,并且加入VBVR 空间推理LORA,进行图像到视频的生成,包含声音的自动生成。工作流执行分为两个采样阶段,并且第二阶段基于输入的原始首帧图使用官方放大模型进行二次视频放大,可以得到高清的视频结果。在二次采样中,工作流也加入了IC细节LoRA和Refocus LoRA优化视频细节。

模型配置

  • ltx-2.3-22b-distilled-1.1_transformer_only_fp8_scaled.safetensors 位置:models\diffusion_models
  • Ltx2.3-Licon-VBVR-I2V-240K-R32.safetensors 位置:models\loras
  • ltx-2.3-22b-ic-lora-refocus.safetensors 位置:models\loras
  • ltx-2-19b-ic-lora-detailer.safetensors 位置:models\loras
  • gemma_3_12B_it_fp8_scaled.safetensors 位置:models\clip
  • ltx-2.3_text_projection_bf16.safetensors 位置:models\text_encoders
  • LTX23_audio_vae_bf16.safetensors 位置:models\vae
  • LTX23_video_vae_bf16.safetensors位置:models\vae
  • ltx-2.3-spatial-upscaler-x2-1.1.safetensors 位置:models\latent_upscale_models

下载链接(根据位置说明找到相应模型):https://www.digitfold.com/5075.html

Image
© 版权声明
THE END
喜欢就支持一下吧
点赞6 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容