🚀 Wan 2.2 和 FLUX Krea 完整教程 — 自动化安装和完美预设
社区文章 发布于 2025 年 8 月 2 日
此仓库包含安装 Wan 2.2 和 FLUX Krea 的完整指南和资源,并提供一键自动化安装程序。利用我们经过数百次参数测试开发的预制优化预设,生成最高质量的视频和图像。本教程利用 SwarmUI 和 ComfyUI 后端,使高级 AI 内容创作易于实现,即使在低端硬件上也能运行。
🎬 观看完整视频教程
点击下方缩略图,观看 YouTube 上的完整分步视频指南。

直接链接: https://youtu.be/8MvvuX4YPeo
✨ 此设置的关键功能
- 自动化一键安装:轻松安装 Wan 2.2、FLUX Krea、SwarmUI 和 ComfyUI。
- 优化预设:获取一整套即用型预设,无需手动调整即可生成顶级视频和图像。
- FLUX Krea DEV 模型:了解如何使用新的 FLUX Krea DEV 模型生成比标准 FLUX Dev 更好的图像。
- 低端硬件友好:SwarmUI 和 ComfyUI 组合经过优化,可在消费级 GPU 上运行。
- 全面指导:从下载先决条件到生成您的第一个杰作,每一步都涵盖在内。
🛠️ 基本资源和链接
💾 核心下载
- SwarmUI 安装程序和 AI 模型下载器:包含 SwarmUI 安装程序、AI 模型下载器应用程序、预设和提示生成器指南。
- ▶️ 从 Patreon 下载
- 高级 ComfyUI 一键安装程序:支持 Flash Attention、Sage Attention、xFormers、Triton、DeepSpeed 和 RTX 5000 系列显卡。
- ▶️ 从 Patreon 下载
🎓 相关教程
- SwarmUI 主要安装指南:在 YouTube 上观看
- RunPod 云安装指南:在 YouTube 上观看
- Massed Compute 云安装指南:在 YouTube 上观看
- 先决条件(Python、Git、CUDA、FFMPEG 等):在 YouTube 上观看
💬 社区与支持
- SECourses 官方 Discord(10,500+ 会员):加入社区
- GitHub 上的 Stable Diffusion 和 AI 资源:在 GitHub 上探索
- SECourses 官方 Reddit:在 Reddit 上订阅
⚙️ 预设概述
我们的自定义预设旨在为您提供开箱即用的最佳结果。将其导入 SwarmUI,即可立即开始创作。
📖 深入:探索 Wan 2.2
Wan 2.2 代表着 AI 驱动的视频和图像生成领域的重大飞跃,专注于电影级质量、效率和用户控制。
什么是 Wan 2.2?
Wan 2.2 是一款经过优化的生成式 AI 模型,适用于“电影语言”。它擅长文本到视频(T2V)和图像到视频(I2V)生成,能够根据描述性提示生成逼真、高分辨率的内容。它支持高达 720p 24fps 的分辨率,并能生成长达 5 秒的片段。作为一款开放模型,它可通过 Hugging Face 等平台访问,并集成到 ComfyUI 等工具中。
主要技术特点
- 专家混合(MoE)架构:使用专用专家模型在不同时间步长上分离去噪过程,扩展容量同时保持计算效率。
- 电影级美学:通过详细标注的光照、构图和色彩,在精选数据上进行训练,实现对电影风格的精确控制。
- 增强的图像和视频生成:改进纹理细节、更高分辨率渲染和精确的风格控制。
- 高级摄像机控制:精确的摄像机运动,如推拉、摇摄和升降镜头,包括运动模糊和速度斜坡。
- 时间一致性:确保连贯的帧到帧过渡,保持角色持久性和流畅的运动。
- SNR 切换机制:在生成过程中在高噪声(结构构建)和低噪声(细节精炼)专家之间切换,模拟专业工作流程。
模型变体
Wan 2.2 提供多种变体,适用于不同的用例
模型变体 | 参数(激活) | 功能 | 关键文件 |
---|---|---|---|
TI2V-5B | 50 亿 | 文本到视频和图像到视频 | wan2.2_ti2v_5B_fp16.safetensors , wan2.2_vae.safetensors |
T2V-A14B | 140 亿 (MoE) | 文本到视频 | wan2.2_t2v_high_noise_14B_fp8_scaled.safetensors , wan2.2_t2v_low_noise_14B_fp8_scaled.safetensors , umt5_xxl_fp8_e4m3fn_scaled.safetensors , wan_2.1_vae.safetensors |
I2V-A14B | 140 亿 (MoE) | 图像到视频 | wan2.2_i2v_high_noise_14B_fp8_scaled.safetensors , wan2.2_i2v_low_noise_14B_fp8_scaled.safetensors , umt5_xxl_fp8_e4m3fn_scaled.safetensors , wan_2.1_vae.safetensors |
系统要求与集成
- 硬件:
TI2V-5B
模型可在消费级 GPU 上运行,推荐 RTX 4090(24GB 显存)。A14B
模型需要多 GPU 设置(8 个 GPU)或云服务以获得最佳性能。 - 集成:通过 ComfyUI 可视化工作流程、Diffusers 和 API 轻松集成。
用例
- 数字艺术与插画:生成概念艺术或动画插画。
- 广告:创建宣传视频和产品视觉效果。
- 电影与预可视化:故事板动画和场景原型。
- 游戏开发:设计角色、环境和技能效果。
- 社交媒体:快速、高质量的短视频内容。
🕒 视频章节
使用这些时间戳导航到您需要的确切部分。
- 0:00 介绍:终极 Wan 2.2 教程
- 1:03 免费提示生成工具和 FLUX Krea Dev 介绍
- 2:01 SwarmUI 和 ComfyUI 如何在低端硬件上实现生成
- 2:46 快速开始:下载安装程序
- 3:10 分步:ComfyUI 的全新安装
- 3:51 分步:SwarmUI 的全新安装
- 4:18 配置 ComfyUI 的 SwarmUI 后端
- 4:53 一键设置:下载所有必需模型
- 5:46 导入终极 SwarmUI 预设包
- 6:22 Wan 2.2 图像到视频生成指南
- 7:33 如何免费生成精彩提示
- 8:12 开始您的第一次生成并监控日志
- 8:53 专业提示:如何修复 GPU 利用率低以获得最大速度
- 10:32 Wan 2.2 文本到视频:选择正确的预设
- 11:22 生成详细的恐龙动画场景
- 12:15 深入分析:8 步与 20 步及 LoRA 影响
- 13:11 寻找最佳参数:CFG 比例和步数
- 13:42 高级优化:使用 TeaCache
- 15:31 FLUX Krea Dev 与 FLUX Dev:并排比较
- 16:26 如何在 FLUX Krea Dev 上轻松训练自己的 LoRA
- 17:02 使用 FLUX Krea Dev 生成高质量图像的完整工作流程
- 18:20 最终评判:并排结果比较
- 19:20 实验:使用 Wan 2.2 生成静态图像
- 21:18 最终想法、总结和未来展望