推理提供商文档
文本到图像
加入 Hugging Face 社区
并获得增强的文档体验
开始使用
文本到图像
根据给定的文本提示生成图像。
有关
text-to-image任务的更多详细信息,请查看其 专用页面!您将找到示例和相关材料。
推荐模型
- black-forest-labs/FLUX.1-Krea-dev: 生成逼真图像的最强大图像生成模型之一。
- Qwen/Qwen-Image: 一个强大的图像生成模型。
- ByteDance/SDXL-Lightning: 强大且快速的图像生成模型。
- ByteDance/Hyper-SD: 一个强大的文本到图像模型。
在此 处 探索所有可用模型,找到最适合您的模型。
使用 API
语言
客户端
提供商
import os
from huggingface_hub import InferenceClient
client = InferenceClient(
provider="fal-ai",
api_key=os.environ["HF_TOKEN"],
)
# output is a PIL.Image object
image = client.text_to_image(
"Astronaut riding a horse",
model="zai-org/GLM-Image",
)API 规范
请求
| 标头 | ||
|---|---|---|
| 授权 | 字符串 | 身份验证头,格式为 'Bearer: hf_****',其中 hf_**** 是具有“推理提供者”权限的个人用户访问令牌。您可以从您的设置页面生成一个。 |
| 有效负载 | ||
|---|---|---|
| inputs* | 字符串 | 输入文本数据(有时称为“提示”) |
| 参数 | 对象 | |
| guidance_scale | 数字 | 较高的引导比例值会促使模型生成与文本提示密切相关的图像,但值过高可能会导致饱和和其他伪影。 |
| negative_prompt | 字符串 | 用于指导图像生成中不应包含的内容的提示。 |
| num_inference_steps | 整数 | 去噪步骤的数量。更多的去噪步骤通常会以牺牲较慢的推理速度来提高图像质量。 |
| 宽度 | 整数 | 输出图像的宽度(以像素为单位) |
| 高度 | 整数 | 输出图像的高度(以像素为单位) |
| 调度器 | 字符串 | 使用兼容的调度器覆盖调度器。 |
| seed | 整数 | 随机数生成器的种子。 |
响应
| 正文 | ||
|---|---|---|
| image | 未知 | 作为原始字节返回的生成的图像。 |