🚀 Wan 2.2 和 FLUX Krea 完整教程 — 自动化安装和完美预设

社区文章 发布于 2025 年 8 月 2 日

此仓库包含安装 Wan 2.2FLUX Krea 的完整指南和资源,并提供一键自动化安装程序。利用我们经过数百次参数测试开发的预制优化预设,生成最高质量的视频和图像。本教程利用 SwarmUIComfyUI 后端,使高级 AI 内容创作易于实现,即使在低端硬件上也能运行。


🎬 观看完整视频教程

点击下方缩略图,观看 YouTube 上的完整分步视频指南。

Wan 2.2 & FLUX Krea Full Tutorial Thumbnail

直接链接: https://youtu.be/8MvvuX4YPeo


✨ 此设置的关键功能

  • 自动化一键安装:轻松安装 Wan 2.2、FLUX Krea、SwarmUI 和 ComfyUI。
  • 优化预设:获取一整套即用型预设,无需手动调整即可生成顶级视频和图像。
  • FLUX Krea DEV 模型:了解如何使用新的 FLUX Krea DEV 模型生成比标准 FLUX Dev 更好的图像。
  • 低端硬件友好:SwarmUI 和 ComfyUI 组合经过优化,可在消费级 GPU 上运行。
  • 全面指导:从下载先决条件到生成您的第一个杰作,每一步都涵盖在内。

🛠️ 基本资源和链接

💾 核心下载

  • SwarmUI 安装程序和 AI 模型下载器:包含 SwarmUI 安装程序、AI 模型下载器应用程序、预设和提示生成器指南。
  • 高级 ComfyUI 一键安装程序:支持 Flash Attention、Sage Attention、xFormers、Triton、DeepSpeed 和 RTX 5000 系列显卡。

🎓 相关教程

💬 社区与支持


⚙️ 预设概述

我们的自定义预设旨在为您提供开箱即用的最佳结果。将其导入 SwarmUI,即可立即开始创作。

Preset Examples


📖 深入:探索 Wan 2.2

Wan 2.2 代表着 AI 驱动的视频和图像生成领域的重大飞跃,专注于电影级质量、效率和用户控制。

什么是 Wan 2.2?

Wan 2.2 是一款经过优化的生成式 AI 模型,适用于“电影语言”。它擅长文本到视频(T2V)和图像到视频(I2V)生成,能够根据描述性提示生成逼真、高分辨率的内容。它支持高达 720p 24fps 的分辨率,并能生成长达 5 秒的片段。作为一款开放模型,它可通过 Hugging Face 等平台访问,并集成到 ComfyUI 等工具中。

主要技术特点

  • 专家混合(MoE)架构:使用专用专家模型在不同时间步长上分离去噪过程,扩展容量同时保持计算效率。
  • 电影级美学:通过详细标注的光照、构图和色彩,在精选数据上进行训练,实现对电影风格的精确控制。
  • 增强的图像和视频生成:改进纹理细节、更高分辨率渲染和精确的风格控制。
  • 高级摄像机控制:精确的摄像机运动,如推拉、摇摄和升降镜头,包括运动模糊和速度斜坡。
  • 时间一致性:确保连贯的帧到帧过渡,保持角色持久性和流畅的运动。
  • SNR 切换机制:在生成过程中在高噪声(结构构建)和低噪声(细节精炼)专家之间切换,模拟专业工作流程。

模型变体

Wan 2.2 提供多种变体,适用于不同的用例

模型变体 参数(激活) 功能 关键文件
TI2V-5B 50 亿 文本到视频和图像到视频 wan2.2_ti2v_5B_fp16.safetensors, wan2.2_vae.safetensors
T2V-A14B 140 亿 (MoE) 文本到视频 wan2.2_t2v_high_noise_14B_fp8_scaled.safetensors, wan2.2_t2v_low_noise_14B_fp8_scaled.safetensors, umt5_xxl_fp8_e4m3fn_scaled.safetensors, wan_2.1_vae.safetensors
I2V-A14B 140 亿 (MoE) 图像到视频 wan2.2_i2v_high_noise_14B_fp8_scaled.safetensors, wan2.2_i2v_low_noise_14B_fp8_scaled.safetensors, umt5_xxl_fp8_e4m3fn_scaled.safetensors, wan_2.1_vae.safetensors

系统要求与集成

  • 硬件TI2V-5B 模型可在消费级 GPU 上运行,推荐 RTX 4090(24GB 显存)。A14B 模型需要多 GPU 设置(8 个 GPU)或云服务以获得最佳性能。
  • 集成:通过 ComfyUI 可视化工作流程、Diffusers 和 API 轻松集成。

用例

  • 数字艺术与插画:生成概念艺术或动画插画。
  • 广告:创建宣传视频和产品视觉效果。
  • 电影与预可视化:故事板动画和场景原型。
  • 游戏开发:设计角色、环境和技能效果。
  • 社交媒体:快速、高质量的短视频内容。

🕒 视频章节

使用这些时间戳导航到您需要的确切部分。

  • 0:00 介绍:终极 Wan 2.2 教程
  • 1:03 免费提示生成工具和 FLUX Krea Dev 介绍
  • 2:01 SwarmUI 和 ComfyUI 如何在低端硬件上实现生成
  • 2:46 快速开始:下载安装程序
  • 3:10 分步:ComfyUI 的全新安装
  • 3:51 分步:SwarmUI 的全新安装
  • 4:18 配置 ComfyUI 的 SwarmUI 后端
  • 4:53 一键设置:下载所有必需模型
  • 5:46 导入终极 SwarmUI 预设包
  • 6:22 Wan 2.2 图像到视频生成指南
  • 7:33 如何免费生成精彩提示
  • 8:12 开始您的第一次生成并监控日志
  • 8:53 专业提示:如何修复 GPU 利用率低以获得最大速度
  • 10:32 Wan 2.2 文本到视频:选择正确的预设
  • 11:22 生成详细的恐龙动画场景
  • 12:15 深入分析:8 步与 20 步及 LoRA 影响
  • 13:11 寻找最佳参数:CFG 比例和步数
  • 13:42 高级优化:使用 TeaCache
  • 15:31 FLUX Krea Dev 与 FLUX Dev:并排比较
  • 16:26 如何在 FLUX Krea Dev 上轻松训练自己的 LoRA
  • 17:02 使用 FLUX Krea Dev 生成高质量图像的完整工作流程
  • 18:20 最终评判:并排结果比较
  • 19:20 实验:使用 Wan 2.2 生成静态图像
  • 21:18 最终想法、总结和未来展望

Final Results Example

社区

注册登录 以评论