社区计算机视觉课程文档
数字处理中的图像采集基础
并获得增强的文档体验
开始使用
数字处理中的图像采集基础
数字处理中的图像采集是将物理现象(我们在现实生活中看到的)转化为数字表示(我们在计算机中看到的)的第一步。它始于照明源与被成像对象之间的相互作用。这种照明可以是各种类型的,从传统光源到更复杂的形式,如电磁或超声能量。这种相互作用导致能量从场景中的物体反射或透射。这种能量被传感器捕获,传感器将一种形式的能量转换为另一种形式的能量(即,传感器将入射能量转换为电压)。然后将电压信号数字化,从而产生数字图像。为此,我们需要先进的技术和精确的校准,以确保我们对物理场景进行准确的表示。在接下来的章节中,我们将探讨其中的一些技术。
传感器技术及其在图像采集中的作用
如前所述,数字成像的第一步是传感器。为了创建二维图像,单个传感元件(如光电二极管)沿着 x 轴和 y 轴移动。相比之下,更常见的传感器条在一个方向上线性捕获图像。因此,为了获得完整的 2D 图像,这些条垂直移动。这项技术常见于平板扫描仪等设备,并用于机载成像系统。在更专业的应用中,如医学成像(例如,CAT 扫描),使用环形配置的传感器条。这些设置涉及复杂的重建高级算法,将捕获的数据转换为有意义的图像。
传感器阵列,如数码相机中的 CCD,由传感元件的 2D 阵列组成。它们无需移动即可捕获完整的图像,因为每个元件都检测场景的一部分。这些阵列的优势在于,与单个传感元件和传感器条不同,它们不需要移动即可捕获图像。捕获的能量聚焦到传感器阵列上,转换为模拟信号,然后数字化以形成数字图像。
数字图像的形成和表示
数字图像形成的核心是函数,它由照明源决定,以及来自场景的反射率。

在基于透射的成像中,如 X 射线,透射率取代了反射率。图像的数字表示本质上是一个数值矩阵或数组,每个数值对应一个像素。将连续图像数据转换为数字格式的过程是双重的
- 采样,它将坐标值数字化。
- 量化,它将幅度值转换为离散量。
数字图像的分辨率和质量在很大程度上取决于以下因素
- 使用的样本数量和离散强度级别。
- 成像系统的动态范围,即最大可测量强度与最小可检测强度之比。这也对图像的外观和对比度起着至关重要的作用。

理解数字成像中的分辨率
空间分辨率是指图像中可区分的最小细节,通常以每单位距离的线对数或每单位距离的像素数来衡量。空间分辨率的意义取决于上下文,并根据使用的空间单位而变化。例如,20 兆像素的相机通常比 8 兆像素的相机提供更高的细节分辨率。强度分辨率与强度级别中最小可检测到的变化有关,并且通常受硬件功能的限制。它以二进制增量量化,例如 8 位或 256 级。对这些强度变化的感知受到多种因素的影响,包括噪声、饱和度以及人类视觉的能力。

图像恢复和重建技术
图像恢复侧重于使用有关退化现象的知识来恢复退化的图像。它通常涉及对退化过程进行建模,并应用逆过程以重新获得原始图像。

相比之下,图像增强更为主观。它旨在改善图像的视觉外观。恢复技术包括处理噪声等问题,噪声可能源于图像采集或传输过程中的各种来源。在这种情况下,自适应和非自适应高级滤波器因其降噪能力而被使用。在医学成像中,特别是在计算机断层扫描 (CT) 中,从投影重建图像是一个至关重要的应用。
图像处理中的色彩
颜色是图像处理中强大的描述符。它在物体识别和辨认中起作用。彩色图像处理包括伪彩色处理和全彩色处理。

伪彩色处理将颜色分配给灰度强度,而全彩色处理使用来自传感器的实际颜色数据。理解色彩的基础知识,包括人类的色彩感知、色谱和彩色光线的属性至关重要。色彩的基础知识包括人类视觉的三色性,即感知红色、绿色和蓝色。另一方面,色彩感知是我们眼睛中三种类型的视锥细胞如何受到刺激。最后,色谱是电磁频谱中引起不同视觉感觉的波长范围。
不同的色彩模型,如用于监视器和相机的 RGB 以及用于印刷的 CMY/CMYK,标准化了数字成像中的色彩表示。在 RGB 色彩模型中,图像有三个分量(即,通道),每个分量分别用于红色、绿色和蓝色。RGB 图像中的像素深度决定了可能的颜色数量,典型的全彩色图像具有 24 位深度(每个颜色分量 8 位)。这允许超过 1600 万种可能的颜色!RGB 彩色立方体表示此模型中可实现的颜色范围,其中灰度从黑色延伸到白色。

图像压缩
数据压缩减少了表示信息所需的数据。它区分了数据(传递信息的手段)和信息本身。它的目标是冗余,即不相关或重复的数据。例如,10:1 的压缩比表示 90% 的数据冗余。
在数字图像压缩中,特别是对于二维强度阵列,主要有三种类型的冗余
- 编码冗余: 编码冗余在图像中尤为普遍,在这些图像中,强度值的分布不会均匀地分布在所有可能的值上,这被描绘为非均匀直方图。在这样的图像中,一些强度值比其他值更频繁地出现,但是自然二进制编码为每个强度值分配相同数量的位来表示,而不管其频率如何。这意味着常用值没有比稀有值更有效地编码,导致位的使用效率低下,从而导致编码冗余。理想情况下,更频繁的值应分配更短的代码,而不太频繁的值应分配更长的代码,以最大限度地减少使用的位数,这在使用非均匀直方图的自然二进制编码中并非如此。
- 空间和时间冗余: 空间和时间冗余出现在图像内或跨视频帧的相关像素值中。
- 不相关信息: 不相关信息包括人眼视觉系统忽略的数据或图像用途不需要的数据。
高效编码考虑事件概率,例如图像中的强度值。诸如行程长度编码之类的技术减少了具有恒定强度线的图像中的空间冗余,从而显着压缩了数据。类似地,可以解决视频序列中的时间冗余。然而,去除不相关信息会导致量化,这是一种不可逆的定量信息丢失。信息论及其熵等概念有助于确定准确图像表示所需的最小数据量。压缩后的图像质量使用客观保真度标准(输入和输出的数学函数)和主观保真度标准(人类评估)进行评估。
图像压缩系统使用编码器和解码器。编码器通过映射(减少空间/时间冗余)、量化(丢弃不相关信息)和符号编码(为量化器输出分配代码)来消除冗余。解码器反转这些过程,但量化除外。图像文件格式、容器和标准(如 JPEG 和 MPEG)用于数据组织和存储。霍夫曼编码是一种用于消除编码冗余的著名方法,它通过首先编码最不可能的源符号来创建高效的表示。
< > 在 GitHub 上更新