社区计算机视觉课程文档

物体检测

Hugging Face's logo
加入 Hugging Face 社区

并获得增强的文档体验

开始使用

目标检测

在本章中,我们将探索目标检测这一引人入胜的领域——它是现代计算机视觉系统中的一项关键任务。我们将揭开基本概念的神秘面纱,讨论流行方法,审视其应用,并讨论评估指标。学完本章,你将打下坚实的基础,并准备好进一步深入高级主题。

Image displaying the bounding boxes around multiple objects in the frame along with the confidence score of their classification

目标检测概述

简介

目标检测是识别和定位数字图像或视频帧中特定对象的任务。它在各个领域都具有深远的影响,包括自动驾驶汽车、人脸识别系统和医疗诊断工具。

分类与定位

分类根据独特属性区分对象,而定位则确定图像中对象的位置。目标检测结合了这两种方法,既定位实体又分配相应的类别标签。想象一下识别不同类型的水果,并在一个图像中精确指出它们的位置。这就是目标检测的体现!

用例

目标检测影响着众多行业,提供宝贵的洞察力和自动化机会。代表性示例包括自动驾驶汽车在道路上行驶,监控系统覆盖广阔的公共空间,医疗成像系统检测疾病,制造工厂保持产量一致性,以及增强现实技术丰富用户体验。

以下是使用transformers进行目标检测的一个例子

from transformers import pipeline
from PIL import Image

pipe = pipeline("object-detection", model="facebook/detr-resnet-50")

image = Image.open("path/to/your/image.jpg").convert("RGB")

bounding_boxes = pipe(image)

如何评估目标检测模型?

你现在已经了解了如何使用目标检测模型,但如何评估它呢?正如前一节所示,目标检测主要是一个监督学习任务。这意味着数据集由图像及其对应的边界框组成,这些边界框作为真实情况。可以使用一些指标来评估你的模型。最常见的指标是:

  • 交并比 (IoU) 或 Jaccard 指数衡量预测标签与参考标签之间的重叠,百分比范围从 0% 到 100%。较高的 IoU 百分比表示更好的对齐,即提高了准确性。在评估跟踪器在不断变化条件下的性能时很有用,例如跟踪迁徙中的野生动物。

  • 平均精度均值 (mAP) 使用精度(正确预测比率)和召回率(真阳性识别能力)来估计目标检测效率。mAP 在不同的 IoU 阈值下计算,作为目标检测算法的整体评估工具。有助于确定模型在具有挑战性条件下的定位和检测性能,例如在制造零件中查找尺寸和形状各异的不规则表面缺陷。

结论和未来工作

理解目标检测为掌握高级计算机视觉技术奠定了基础,从而能够构建强大而准确的解决方案,满足严苛的需求。未来的一些研究领域包括开发快速且易于部署的轻量级目标检测模型。探索 3D 空间中的目标检测领域,例如用于增强现实应用,是另一个值得探索的方向。

参考文献和附加资源

< > 在 GitHub 上更新