LTX2.3图生视频音画同出高清版-数字折叠

工作流介绍

该工作流基于ltx2.3 蒸馏版1.1大模型，并且加入VBVR 空间推理LORA,进行图像到视频的生成，包含声音的自动生成。工作流执行分为两个采样阶段，并且第二阶段基于输入的原始首帧图使用官方放大模型进行二次视频放大，可以得到高清的视频结果。在二次采样中，工作流也加入了IC细节LoRA和Refocus LoRA优化视频细节。

模型配置

ltx-2.3-22b-distilled-1.1_transformer_only_fp8_scaled.safetensors 位置：models\diffusion_models
Ltx2.3-Licon-VBVR-I2V-240K-R32.safetensors 位置：models\loras
ltx-2.3-22b-ic-lora-refocus.safetensors 位置：models\loras
ltx-2-19b-ic-lora-detailer.safetensors 位置：models\loras
gemma_3_12B_it_fp8_scaled.safetensors 位置：models\clip
ltx-2.3_text_projection_bf16.safetensors 位置：models\text_encoders
LTX23_audio_vae_bf16.safetensors 位置：models\vae
LTX23_video_vae_bf16.safetensors位置：models\vae
ltx-2.3-spatial-upscaler-x2-1.1.safetensors 位置：models\latent_upscale_models