推理提供商文档
目标检测
加入 Hugging Face 社区
并获得增强的文档体验
开始使用
目标检测
目标检测模型允许用户识别某些定义类别的对象。这些模型接收图像作为输入,并输出带有边界框和检测到的对象标签的图像。
有关 `object-detection` 任务的更多详细信息,请查看其专用页面!您将找到示例和相关资料。
推荐模型
- facebook/detr-resnet-50:在 COCO 2017 数据集上预训练的可靠目标检测模型。
在此处探索所有可用模型并找到最适合您的模型。
使用 API
语言
客户端
提供商
import os
from huggingface_hub import InferenceClient
client = InferenceClient(
provider="hf-inference",
api_key=os.environ["HF_TOKEN"],
)
output = client.object_detection("cats.jpg", model="facebook/detr-resnet-50")
API 规范
请求
标头 | ||
---|---|---|
授权 | 字符串 | 认证头,格式为 `Bearer: hf_****`,其中 `hf_****` 是具有“推理提供商”权限的个人用户访问令牌。您可以从您的设置页面生成一个。 |
有效负载 | ||
---|---|---|
inputs* | 字符串 | 作为 base64 编码字符串的输入图像数据。如果未提供 `parameters`,您也可以将图像数据作为原始字节负载提供。 |
参数 | 对象 | |
阈值 | 数字 | 进行预测所需的概率。 |
响应
正文 | ||
---|---|---|
(数组) | 对象数组 | 输出是一个对象数组。 |
标签 | 字符串 | 边界框的预测标签。 |
分数 | 数字 | 关联的分数/概率。 |
框 | 对象 | |
xmin | 整数 | 边界框左上角的 x 坐标。 |
xmax | 整数 | 边界框右下角的 x 坐标。 |
ymin | 整数 | 边界框左上角的 y 坐标。 |
ymax | 整数 | 边界框右下角的 y 坐标。 |