新文生图模型王者是通义万相——FLUX DEV 对比 FLUX Krea 对比 通义万相 写实 vs 通义万相 最高质量
作者:Furkan Gözükara - 计算机工程博士,SECourses
我已经完成了超过 700 次生成,以找出在通义万相模型中生成最佳图像的最佳配置。我已在以下帖子中分享了预设和网格图像
我们的预设是在对所有实验进行极其仔细的分析后制定的。上述链接的压缩文件还包含自动下载所有通义万相模型等的下载器。
此处共享的完整质量图库图像
在这篇文章的下方,我还上传了图片到这里,但这里是压缩过的。
我使用了拥有 8x A6000 GPU 的机器进行实验,但如果您的 RAM 足够,通义万相模型甚至可以在 6 GB 显存的 GPU 上运行。
当您分析网格时,您还会发现即使是通义万相的 Q4_1 也能产生惊人的效果。如果您的 RAM 足够,即使是 6 GB 显存的 GPU 也能使用此模型生成惊艳的图像。
如何在以下视频中安装带有 Flash Attention、Sage Attention、xFormers、Triton、DeepSpeed、Insightface、onnxruntime-gpu、GGUF 的 ComfyUI 教程
安装程序压缩文件在此处共享,一键安装,支持 RTX 5000 系列和 Python 3.10、3.11 和 3.12(推荐 3.10.11)。
ComfyUI 安装程序压缩文件:https://www.patreon.com/posts/105023709
如何在以下视频中安装 SwarmUI 并使用现有 ComfyUI 作为后端并使用我们的预设教程
- 在以下帖子中分享了大量模型下载器、SwarmUI 安装程序和惊人的预设
- 强烈建议使用我们的 ComfyUI 安装程序,因为它自动安装了完美的库集,并且易于正确更新。
对比图片
如何使用 ComfyUI、SwarmUI 和通义万相等
在使用通义万相模型之前,必须更新您的 ComfyUI 和 SwarmUI。
要更新,请使用最新的压缩文件并运行
Windows_Update_SwarmUI
和Windows_Update_ComfyUI
批处理文件。如果您想在 RunPod 上使用 ComfyUI 或 SwarmUI,请参阅以下最新教程
如果您想在 Massed Compute 上使用 ComfyUI 或 SwarmUI(我推荐),请参阅以下最新教程
请查看视频章节,找到相关部分,例如:
36:08 大规模计算 — 高级:与预装的 SwarmUI 集成
通义万相模型分析
- 通义万相对提示的理解和遵循能力远超 FLUX Dev。
- 它的真实感也优于 FLUX Dev,但尚未达到 FLUX Krea Dev 的水平。
- 然而,通过 LoRA 或微调,它无疑将超越 FLUX 模型。
- 此外,通义万相的默认分辨率为 1328x1328(1,763,584 像素),而 FLUX Dev 的分辨率为 1024x1024(1,048,576 像素)。
- 因此,通义万相的原生分辨率比 FLUX Dev 大 68%,这是原生分辨率和质量上的重大改进。
- 我们为通义万相提供了两种预设
- 通义万相 高质量:更好地遵循提示,更好地生成复杂场景(所需时间是快速预设的两倍)。
- 通义万相 写实快速:生成更真实的输出。
- 此外,我们的预设稳健,因此它们在 20-50 步之间表现良好。
- 步数越多效果越好,但 20 步也可以接受。
- 希望通义万相的训练能够进入 Kohya Musubi Tuner,我将制作一个一键安装并运行 Musubi Tuner GUI,用于通义万相的训练和研究,并找出最佳训练参数,为每种 GPU 准备配置文件。
- 我预计,如果您有足够的 RAM,即使是 6 GB 显存的 GPU 也能训练通义万相。
- 请仔细查看上面帖子的图片,以清楚地看到通义万相与 FLUX 之间的区别——它们是最高质量的。
- 此外,您可以从这个帖子下载完整的网格(超过 1.6 GB):https://www.patreon.com/posts/114517862
教程宝库
我们还有更多教程,当你理解工作流程后,大多数都非常容易遵循。
首先,请严格遵循以下要求教程——这只需安装和使用所有 AI 应用程序和模型一次。
Wan 2.2 和 FLUX Krea 完整教程 — 自动化安装 — 完美预设 — 带 ComfyUI 的 SwarmUI
SECourses 视频和图像升频器 Pro STAR 与 TOPAZ StarLight 对比基于图像的最佳升频器
MultiTalk 完整教程,一键安装 — 从静态图像制作说话和唱歌的视频
FLUX Kontext Dev 详细本地 Windows 操作教程 — 优于 ChatGPT 和 Gemini 的图像编辑
WAN 2.1 FusionX 是本地视频生成的最新最佳选择,仅需 8 步 + FLUX 升频指南
ComfyUI 和 SwarmUI 在 RunPod 上的终极教程,附带 RTX 5000 系列 GPU 和一键设置
Hi3DGen 完整教程,附带超高级应用程序,可从静态图像本地生成最佳 3D 网格
逐步 TRELLIS 教程,从静态图像本地生成惊人的高质量 3D 资产
SwarmUI Teacache 完整教程,附带最佳 Wan 2.1 I2V 和 T2V 预设 — ComfyUI 用作后端
FramePack 完整教程:一键在 Windows 上安装 — 可将图像转换为长达 120 秒的视频,仅需 6GB
我们的安装程序
- 我们的安装程序始终自动生成一个隔离的 Python VENV 并将库安装到其中。
- 因此,它们绝不会损坏您的计算机或现有运行的应用程序。