Inference Providers 文档
文本到图像
加入 Hugging Face 社区
并访问增强的文档体验
开始使用
文本到图像
根据给定的文本提示生成图像。
有关 text-to-image
任务的更多详细信息,请查看其专用页面!您将在其中找到示例和相关材料。
推荐模型
- black-forest-labs/FLUX.1-dev: 最强大的图像生成模型之一,可以生成逼真的输出。
- Kwai-Kolors/Kolors: 用于照片级真实感生成的文本到图像模型。
- stabilityai/stable-diffusion-3-medium-diffusers: 强大的文本到图像模型。
浏览所有可用模型,找到最适合您的模型此处。
使用 API
from huggingface_hub import InferenceClient
client = InferenceClient(
provider="fal-ai",
api_key="hf_xxxxxxxxxxxxxxxxxxxxxxxx",
)
# output is a PIL.Image object
image = client.text_to_image(
"Astronaut riding a horse",
model="black-forest-labs/FLUX.1-dev",
)
API 规范
请求
载荷 | ||
---|---|---|
inputs* | 字符串 | 输入文本数据(有时称为“提示”) |
parameters | 对象 | |
guidance_scale | 数字 | 较高的 guidance scale 值会鼓励模型生成与文本提示紧密相关的图像,但过高的值可能会导致饱和和其他伪影。 |
negative_prompt | 字符串 | 用于指导图像生成中不应包含内容的一个提示。 |
num_inference_steps | 整数 | 去噪步骤的数量。 更多的去噪步骤通常会带来更高质量的图像,但会降低推理速度。 |
width | 整数 | 输出图像的宽度(像素) |
height | 整数 | 输出图像的高度(像素) |
scheduler | 字符串 | 使用兼容的调度器覆盖默认调度器。 |
seed | 整数 | 随机数生成器的种子。 |
某些选项可以通过将标头传递给 Inference API 来配置。 以下是可用的标头
标头 | ||
---|---|---|
authorization | 字符串 | 'Bearer: hf_****' 形式的身份验证标头,其中 hf_**** 是具有 Inference API 权限的个人用户访问令牌。 您可以从您的设置页面生成一个。 |
x-use-cache | 布尔值,默认为 true | Inference API 上有一个缓存层,用于加速我们已经看到的请求。 大多数模型都可以使用这些结果,因为它们是确定性的(意味着无论如何输出都将相同)。 但是,如果您使用非确定性模型,则可以设置此参数以阻止使用缓存机制,从而产生真正的全新查询。 阅读此处了解有关缓存的更多信息。 |
x-wait-for-model | 布尔值,默认为 false | 如果模型尚未准备好,请等待它而不是接收 503 错误。 它限制了完成推理所需的请求数量。 建议仅在收到 503 错误后才将此标志设置为 true,因为它会将应用程序中的挂起限制在已知位置。 阅读此处了解有关模型可用性的更多信息。 |
有关 Inference API 标头的更多信息,请查看指南中的参数。
响应
主体 | ||
---|---|---|
image | unknown | 生成的图像以原始字节形式在载荷中返回。 |