新文生图模型王者是通义万相——FLUX DEV 对比 FLUX Krea 对比 通义万相 写实 vs 通义万相 最高质量

社区文章 发布于2025年8月6日

作者:Furkan Gözükara - 计算机工程博士,SECourses


我已经完成了超过 700 次生成,以找出在通义万相模型中生成最佳图像的最佳配置。我已在以下帖子中分享了预设和网格图像

我们的预设是在对所有实验进行极其仔细的分析后制定的。上述链接的压缩文件还包含自动下载所有通义万相模型等的下载器。

此处共享的完整质量图库图像

在这篇文章的下方,我还上传了图片到这里,但这里是压缩过的。

  • 我使用了拥有 8x A6000 GPU 的机器进行实验,但如果您的 RAM 足够,通义万相模型甚至可以在 6 GB 显存的 GPU 上运行。

  • 当您分析网格时,您还会发现即使是通义万相的 Q4_1 也能产生惊人的效果。如果您的 RAM 足够,即使是 6 GB 显存的 GPU 也能使用此模型生成惊艳的图像。

  • 如何在以下视频中安装带有 Flash Attention、Sage Attention、xFormers、Triton、DeepSpeed、Insightface、onnxruntime-gpu、GGUF 的 ComfyUI 教程

    How to install ComfyUI with advanced features


  • 安装程序压缩文件在此处共享,一键安装,支持 RTX 5000 系列和 Python 3.10、3.11 和 3.12(推荐 3.10.11)。

  • ComfyUI 安装程序压缩文件:https://www.patreon.com/posts/105023709

  • 如何在以下视频中安装 SwarmUI 并使用现有 ComfyUI 作为后端并使用我们的预设教程

    How to install SwarmUI with ComfyUI backend


  • 在以下帖子中分享了大量模型下载器、SwarmUI 安装程序和惊人的预设
  • 强烈建议使用我们的 ComfyUI 安装程序,因为它自动安装了完美的库集,并且易于正确更新。

Qwen Image Model Comparison

对比图片

Comparison 1 Comparison 2 Comparison 3 Comparison 4 Comparison 5 Comparison 6 Comparison 7 Comparison 8 Comparison 9 Comparison 10



如何使用 ComfyUI、SwarmUI 和通义万相等

  • 在使用通义万相模型之前,必须更新您的 ComfyUI 和 SwarmUI。

  • 要更新,请使用最新的压缩文件并运行 Windows_Update_SwarmUIWindows_Update_ComfyUI 批处理文件。

  • 如果您想在 RunPod 上使用 ComfyUI 或 SwarmUI,请参阅以下最新教程

    ComfyUI on RunPod Tutorial

  • 如果您想在 Massed Compute 上使用 ComfyUI 或 SwarmUI(我推荐),请参阅以下最新教程

    ComfyUI on Massed Compute Tutorial

  • 请查看视频章节,找到相关部分,例如:36:08 大规模计算 — 高级:与预装的 SwarmUI 集成


通义万相模型分析

  • 通义万相对提示的理解和遵循能力远超 FLUX Dev。
  • 它的真实感也优于 FLUX Dev,但尚未达到 FLUX Krea Dev 的水平。
  • 然而,通过 LoRA 或微调,它无疑将超越 FLUX 模型。
  • 此外,通义万相的默认分辨率为 1328x1328(1,763,584 像素),而 FLUX Dev 的分辨率为 1024x1024(1,048,576 像素)。
  • 因此,通义万相的原生分辨率比 FLUX Dev 大 68%,这是原生分辨率和质量上的重大改进。
  • 我们为通义万相提供了两种预设
    • 通义万相 高质量:更好地遵循提示,更好地生成复杂场景(所需时间是快速预设的两倍)。
    • 通义万相 写实快速:生成更真实的输出。
  • 此外,我们的预设稳健,因此它们在 20-50 步之间表现良好。
  • 步数越多效果越好,但 20 步也可以接受。
  • 希望通义万相的训练能够进入 Kohya Musubi Tuner,我将制作一个一键安装并运行 Musubi Tuner GUI,用于通义万相的训练和研究,并找出最佳训练参数,为每种 GPU 准备配置文件。
  • 我预计,如果您有足够的 RAM,即使是 6 GB 显存的 GPU 也能训练通义万相。
  • 请仔细查看上面帖子的图片,以清楚地看到通义万相与 FLUX 之间的区别——它们是最高质量的。
  • 此外,您可以从这个帖子下载完整的网格(超过 1.6 GB):https://www.patreon.com/posts/114517862

教程宝库

  • 我们还有更多教程,当你理解工作流程后,大多数都非常容易遵循。

  • 首先,请严格遵循以下要求教程——这只需安装和使用所有 AI 应用程序和模型一次。

    AI Requirements Tutorial

  • Wan 2.2 和 FLUX Krea 完整教程 — 自动化安装 — 完美预设 — 带 ComfyUI 的 SwarmUI

    Wan 2.2 & FLUX Krea Tutorial

  • SECourses 视频和图像升频器 Pro STAR 与 TOPAZ StarLight 对比基于图像的最佳升频器

    Upscaler Comparison Tutorial

  • MultiTalk 完整教程,一键安装 — 从静态图像制作说话和唱歌的视频

    MultiTalk Full Tutorial

  • FLUX Kontext Dev 详细本地 Windows 操作教程 — 优于 ChatGPT 和 Gemini 的图像编辑

    FLUX Kontext Dev Tutorial

  • WAN 2.1 FusionX 是本地视频生成的最新最佳选择,仅需 8 步 + FLUX 升频指南

    WAN 2.1 FusionX Tutorial

  • ComfyUI 和 SwarmUI 在 RunPod 上的终极教程,附带 RTX 5000 系列 GPU 和一键设置

    Ultimate ComfyUI & SwarmUI on RunPod Tutorial

  • Hi3DGen 完整教程,附带超高级应用程序,可从静态图像本地生成最佳 3D 网格

    Hi3DGen Full Tutorial

  • 逐步 TRELLIS 教程,从静态图像本地生成惊人的高质量 3D 资产

    TRELLIS Tutorial

  • SwarmUI Teacache 完整教程,附带最佳 Wan 2.1 I2V 和 T2V 预设 — ComfyUI 用作后端

    SwarmUI Teacache Tutorial

  • FramePack 完整教程:一键在 Windows 上安装 — 可将图像转换为长达 120 秒的视频,仅需 6GB

    FramePack Full Tutorial

我们的安装程序

  • 我们的安装程序始终自动生成一个隔离的 Python VENV 并将库安装到其中。
  • 因此,它们绝不会损坏您的计算机或现有运行的应用程序。

Installer Screenshot 1 Installer Screenshot 2

Full Tutorial Screenshot

社区

注册登录 以评论