Inference Providers 文档

目标检测

Hugging Face's logo
加入 Hugging Face 社区

并获得增强的文档体验

开始使用

目标检测

目标检测模型允许用户识别特定类别的物体。这些模型接收图像作为输入,并输出带有边界框和标签的检测到的物体的图像。

有关 object-detection 任务的更多详细信息,请查看其专用页面!您将在那里找到示例和相关材料。

推荐模型

浏览所有可用的模型,找到最适合您的模型此处

使用 API

from huggingface_hub import InferenceClient

client = InferenceClient(
    provider="hf-inference",
    api_key="hf_xxxxxxxxxxxxxxxxxxxxxxxx",
)

output = client.object_detection("cats.jpg", model="facebook/detr-resnet-50")

API 规范

请求

负载
inputs* 字符串 输入图像数据,为 base64 编码的字符串。如果未提供 parameters,您也可以将图像数据作为原始字节负载提供。
parameters 对象
        threshold 数字 进行预测所需的概率。

某些选项可以通过将标头传递给 Inference API 进行配置。以下是可用的标头

标头
authorization 字符串 身份验证标头,格式为 'Bearer: hf_****',其中 hf_**** 是具有 Inference API 权限的个人用户访问令牌。您可以从您的设置页面生成一个。
x-use-cache 布尔值,默认为 true Inference API 上有一个缓存层,用于加速我们已经看到的请求。大多数模型都可以使用这些结果,因为它们是确定性的(意味着输出无论如何都是相同的)。但是,如果您使用非确定性模型,您可以设置此参数以防止使用缓存机制,从而产生真正的全新查询。阅读有关缓存的更多信息此处
x-wait-for-model 布尔值,默认为 false 如果模型尚未准备好,请等待它而不是接收 503。它限制了完成推理所需的请求数量。建议仅在收到 503 错误后才将此标志设置为 true,因为它会将应用程序中的挂起限制在已知位置。阅读有关模型可用性的更多信息此处

有关 Inference API 标头的更多信息,请查看参数指南

响应

正文
(数组) 对象数组 输出是对象数组。
        label 字符串 边界框的预测标签。
        score 数字 相关的分数/概率。
        box 对象
                xmin 整数 边界框左上角的 x 坐标。
                xmax 整数 边界框右下角的 x 坐标。
                ymin 整数 边界框左上角的 y 坐标。
                ymax 整数 边界框右下角的 y 坐标。
< > 在 GitHub 上更新