文本到图像
根据给定的文本提示生成图像。
有关text-to-image
任务的更多详细信息,请查看其专用页面!您将找到示例和相关材料。
推荐模型
- black-forest-labs/FLUX.1-dev:能够生成逼真输出的最强大的图像生成模型之一。
- stabilityai/stable-diffusion-3-medium-diffusers:一个强大的文本到图像模型。
探索所有可用的模型并找到最适合您的模型在此处。
使用 API
Python
JavaScript
cURL
import requests
API_URL = "https://api-inference.huggingface.co/models/black-forest-labs/FLUX.1-dev"
headers = {"Authorization": "Bearer hf_***"}
def query(payload):
response = requests.post(API_URL, headers=headers, json=payload)
return response.content
image_bytes = query({
"inputs": "Astronaut riding a horse",
})
# You can access the image with PIL.Image for example
import io
from PIL import Image
image = Image.open(io.BytesIO(image_bytes))
要使用 Python 客户端,请参阅huggingface_hub
的包参考。
API 规范
请求
有效负载 | ||
---|---|---|
inputs* | 字符串 | 输入文本数据(有时称为“提示”) |
参数 | 对象 | 文本到图像的其他推理参数 |
guidance_scale | 数字 | 较高的引导比例值鼓励模型生成与文本提示紧密相关的图像,但过高的值可能会导致饱和和其他伪影。 |
negative_prompt | 字符串[] | 一个或多个提示,以指导图像生成中**不应包含**的内容。 |
num_inference_steps | 整数 | 降噪步骤的数量。更多的降噪步骤通常会导致更高的图像质量,但代价是推理速度较慢。 |
target_size | 对象 | 输出图像的像素大小 |
width* | 整数 | |
height* | 整数 | |
scheduler | 字符串 | 使用兼容的调度程序覆盖。 |
seed | 整数 | 随机数生成器的种子。 |
可以通过将标头传递到推理 API 来配置某些选项。以下是可用的标头
标头 | ||
---|---|---|
authorization | 字符串 | 当hf_**** 是具有推理 API 权限的个人用户访问令牌时,身份验证标头采用'Bearer: hf_****' 的形式。您可以从您的设置页面生成一个。 |
x-use-cache | 布尔值,默认为true | 推理 API 上有一个缓存层,用于加速我们已经处理过的请求。大多数模型可以使用这些结果,因为它们是确定性的(意味着输出始终相同)。但是,如果您使用非确定性模型,您可以设置此参数以防止使用缓存机制,从而导致一个真正的新的查询。有关缓存的更多信息,请点击此处。 |
x-wait-for-model | 布尔值,默认为false | 如果模型未就绪,请等待它,而不是接收 503 错误。它限制了完成推理所需的请求数量。建议仅在收到 503 错误后才将此标志设置为 true,因为它会将应用程序挂起限制在已知位置。有关模型可用性的更多信息,请点击此处。 |
有关推理 API 标头的更多信息,请查看参数指南。
响应
主体 | ||
---|---|---|
图像 | 未知 | 生成的图像以有效负载中的原始字节形式返回。 |