目标检测
目标检测模型允许用户识别某些已定义类别的对象。这些模型接收图像作为输入,并输出带有边界框和检测到的对象标签的图像。
有关object-detection
任务的更多详细信息,请查看其专用页面!您会发现示例和相关资料。
推荐模型
- facebook/detr-resnet-50:在基准数据集 COCO 2017 上训练的可靠目标检测模型。
- microsoft/beit-base-patch16-224-pt22k-ft22k:在 ImageNet-21k 数据集上训练的强大的目标检测模型。
探索所有可用的模型并找到最适合您的模型在此处。
使用 API
Python
JavaScript
cURL
import requests
API_URL = "https://api-inference.huggingface.co/models/facebook/detr-resnet-50"
headers = {"Authorization": "Bearer hf_***"}
def query(filename):
with open(filename, "rb") as f:
data = f.read()
response = requests.post(API_URL, headers=headers, data=data)
return response.json()
output = query("cats.jpg")
要使用 Python 客户端,请参阅huggingface_hub
的包参考。
API 规范
请求
有效负载 | ||
---|---|---|
输入* | 字符串 | 作为 base64 编码字符串的输入图像数据。如果没有提供parameters ,您也可以将图像数据作为原始字节有效负载提供。 |
参数 | 对象 | 目标检测的其他推理参数 |
阈值 | 数字 | 进行预测所需的概率。 |
可以通过将标头传递到推理 API 来配置某些选项。以下是可用的标头
标头 | ||
---|---|---|
授权 | 字符串 | 当hf_**** 是具有推理 API 权限的个人用户访问令牌时,表单'Bearer: hf_****' 中的身份验证标头。您可以从您的设置页面生成一个。 |
x-use-cache | 布尔值,默认为true | 推理 API 上有一个缓存层,用于加速我们已经处理过的请求。大多数模型都可以直接使用这些结果,因为它们是确定性的(这意味着输出始终相同)。但是,如果您使用非确定性模型,可以设置此参数以阻止缓存机制的使用,从而产生一个真正的新的查询。阅读有关缓存的更多信息,请点击此处。 |
x-wait-for-model | 布尔值,默认为 false | 如果模型未准备好,请等待它,而不是接收 503 错误。这可以减少获取推理结果所需的请求次数。建议仅在收到 503 错误后才将此标志设置为 true,因为它会将应用程序挂起限制在已知的位置。阅读有关模型可用性的更多信息,请点击此处。 |
有关推理 API 标头的更多信息,请查看参数指南。
响应
主体 | ||
---|---|---|
(数组) | object[] | 输出是一个对象数组。 |
标签 | 字符串 | 边界框的预测标签。 |
得分 | 数字 | 关联的分数/概率。 |
框 | 对象 | |
xmin | 整数 | 边界框左上角的 x 坐标。 |
xmax | 整数 | 边界框右下角的 x 坐标。 |
ymin | 整数 | 边界框左上角的 y 坐标。 |
ymax | 整数 | 边界框右下角的 y 坐标。 |