Inference Providers 文档

图像到图像

Hugging Face's logo
加入 Hugging Face 社区

并获得增强的文档体验

开始使用

图像到图像

图像到图像是将源图像转换为匹配目标图像或目标图像域特征的任务。

应用示例

  • 将一个图像的风格转移到另一个图像
  • 为黑白图像着色
  • 提高图像的分辨率

有关 image-to-image 任务的更多详细信息,请查看其专用页面!您将在其中找到示例和相关材料。

推荐模型

浏览所有可用的模型,找到最适合您的模型 此处

使用 API

from huggingface_hub import InferenceClient

client = InferenceClient(
    provider="hf-inference",
    api_key="hf_xxxxxxxxxxxxxxxxxxxxxxxx",
)

# output is a PIL.Image object
image = client.image_to_image(
    "cat.png",
    prompt="Turn the cat into a tiger.",
    model="enhanceaiteam/Flux-Uncensored-V2",
)

API 规范

请求

载荷
inputs* 字符串 作为 base64 编码字符串的输入图像数据。如果未提供 parameters,您也可以将图像数据作为原始字节载荷提供。
parameters 对象
        prompt 字符串 用于指导图像生成的文本提示。
        guidance_scale 数字 对于扩散模型。较高的 guidance scale 值会鼓励模型生成与文本提示紧密相关的图像,但会牺牲图像质量。
        negative_prompt 字符串 一个提示,用于指导图像生成中不包含的内容。
        num_inference_steps 整数 对于扩散模型。去噪步骤的数量。更多的去噪步骤通常会以较慢的推理速度为代价, menghasilkan 更高质量的图像。
        target_size 对象 输出图像的像素尺寸。
                width* 整数
                height* 整数

某些选项可以通过将标头传递到 Inference API 进行配置。以下是可用的标头

标头
authorization 字符串 hf_**** 是具有 Inference API 权限的个人用户访问令牌时,格式为 'Bearer: hf_****' 的身份验证标头。您可以从您的设置页面生成一个。
x-use-cache 布尔值,默认为 true Inference API 上有一个缓存层,用于加速我们已经看到的请求。大多数模型可以使用这些结果,因为它们是确定性的(意味着无论如何输出都将相同)。但是,如果您使用非确定性模型,则可以设置此参数以防止使用缓存机制,从而产生真正的全新查询。阅读更多关于缓存的信息此处
x-wait-for-model 布尔值,默认为 false 如果模型未准备好,请等待它,而不是收到 503 错误。这限制了完成推理所需的请求数量。建议仅在收到 503 错误后才将此标志设置为 true,因为这将限制应用程序中的挂起位置为已知位置。阅读更多关于模型可用性的信息此处

有关 Inference API 标头的更多信息,请查看参数指南

响应

主体
image 未知 作为原始字节在载荷中返回的输出图像。
< > 在 GitHub 上更新