推理提供商文档

目标检测

Hugging Face's logo
加入 Hugging Face 社区

并获得增强的文档体验

开始使用

目标检测

目标检测模型允许用户识别某些定义类别的对象。这些模型接收图像作为输入,并输出带有边界框和检测到的对象标签的图像。

有关 `object-detection` 任务的更多详细信息,请查看其专用页面!您将找到示例和相关资料。

推荐模型

在此处探索所有可用模型并找到最适合您的模型。

使用 API

import os
from huggingface_hub import InferenceClient

client = InferenceClient(
    provider="hf-inference",
    api_key=os.environ["HF_TOKEN"],
)

output = client.object_detection("cats.jpg", model="facebook/detr-resnet-50")

API 规范

请求

标头
授权 字符串 认证头,格式为 `Bearer: hf_****`,其中 `hf_****` 是具有“推理提供商”权限的个人用户访问令牌。您可以从您的设置页面生成一个。
有效负载
inputs* 字符串 作为 base64 编码字符串的输入图像数据。如果未提供 `parameters`,您也可以将图像数据作为原始字节负载提供。
参数 对象
        阈值 数字 进行预测所需的概率。

响应

正文
(数组) 对象数组 输出是一个对象数组。
        标签 字符串 边界框的预测标签。
        分数 数字 关联的分数/概率。
        框 对象
                xmin 整数 边界框左上角的 x 坐标。
                xmax 整数 边界框右下角的 x 坐标。
                ymin 整数 边界框左上角的 y 坐标。
                ymax 整数 边界框右下角的 y 坐标。
< > 在 GitHub 上更新