文本到图像

根据给定的文本提示生成图像。

有关 `text-to-image` 任务的更多详细信息，请查看其专用页面！您将找到示例和相关材料。

使用 API

语言

客户端

提供商

设置

import os
from huggingface_hub import InferenceClient

client = InferenceClient(
    provider="fal-ai",
    api_key=os.environ["HF_TOKEN"],
)

# output is a PIL.Image object
image = client.text_to_image(
    "Astronaut riding a horse",
    model="Qwen/Qwen-Image",
)

API 规范

请求

标头
授权	字符串	认证头格式为 `Bearer: hf_**`，其中 `hf_**` 是具有“推理提供商”权限的个人用户访问令牌。您可以从您的设置页面生成一个。

有效负载
inputs*	字符串	输入文本数据（有时称为“提示”）
参数	对象
guidance_scale	数字	更高的指导尺度值会促使模型生成与文本提示紧密相关的图像，但过高的值可能会导致饱和和其他伪影。
negative_prompt	字符串	一个提示，用于指导图像生成中不应包含的内容。
num_inference_steps	整数	去噪步数。更多的去噪步数通常会带来更高质量的图像，但推理速度会变慢。
width	整数	输出图像的宽度（像素）
height	整数	输出图像的高度（像素）
scheduler	字符串	用兼容的调度器覆盖当前调度器。
seed	整数	随机数生成器的种子。

响应

正文
image	未知	生成的图像以原始字节的形式在负载中返回。

< > 在 GitHub 上更新

推理服务提供商

文本到图像

推荐模型

使用 API

API 规范

请求

响应