Inference Providers 文档

文本到图像

Hugging Face's logo
加入 Hugging Face 社区

并访问增强的文档体验

开始使用

文本到图像

根据给定的文本提示生成图像。

有关 text-to-image 任务的更多详细信息,请查看其专用页面!您将在其中找到示例和相关材料。

推荐模型

浏览所有可用模型,找到最适合您的模型此处

使用 API

from huggingface_hub import InferenceClient

client = InferenceClient(
    provider="fal-ai",
    api_key="hf_xxxxxxxxxxxxxxxxxxxxxxxx",
)

# output is a PIL.Image object
image = client.text_to_image(
    "Astronaut riding a horse",
    model="black-forest-labs/FLUX.1-dev",
)

API 规范

请求

载荷
inputs* 字符串 输入文本数据(有时称为“提示”)
parameters 对象
        guidance_scale 数字 较高的 guidance scale 值会鼓励模型生成与文本提示紧密相关的图像,但过高的值可能会导致饱和和其他伪影。
        negative_prompt 字符串 用于指导图像生成中不应包含内容的一个提示。
        num_inference_steps 整数 去噪步骤的数量。 更多的去噪步骤通常会带来更高质量的图像,但会降低推理速度。
        width 整数 输出图像的宽度(像素)
        height 整数 输出图像的高度(像素)
        scheduler 字符串 使用兼容的调度器覆盖默认调度器。
        seed 整数 随机数生成器的种子。

某些选项可以通过将标头传递给 Inference API 来配置。 以下是可用的标头

标头
authorization 字符串 'Bearer: hf_****' 形式的身份验证标头,其中 hf_**** 是具有 Inference API 权限的个人用户访问令牌。 您可以从您的设置页面生成一个。
x-use-cache 布尔值,默认为 true Inference API 上有一个缓存层,用于加速我们已经看到的请求。 大多数模型都可以使用这些结果,因为它们是确定性的(意味着无论如何输出都将相同)。 但是,如果您使用非确定性模型,则可以设置此参数以阻止使用缓存机制,从而产生真正的全新查询。 阅读此处了解有关缓存的更多信息。
x-wait-for-model 布尔值,默认为 false 如果模型尚未准备好,请等待它而不是接收 503 错误。 它限制了完成推理所需的请求数量。 建议仅在收到 503 错误后才将此标志设置为 true,因为它会将应用程序中的挂起限制在已知位置。 阅读此处了解有关模型可用性的更多信息。

有关 Inference API 标头的更多信息,请查看指南中的参数。

响应

主体
image unknown 生成的图像以原始字节形式在载荷中返回。
< > 在 GitHub 上更新