社区计算机视觉课程文档
数字处理中的图像采集基础
并获得增强的文档体验
开始使用
数字处理中的图像采集基础
数字处理中的图像采集是将物理现象(我们在现实生活中看到的东西)转化为数字表示(我们在计算机中看到的东西)的第一步。它始于照明源与被成像对象之间的相互作用。这种照明可以是各种类型,从传统光源到更复杂的形式,如电磁或超声波能量。这种相互作用导致能量从场景中的物体反射或穿透。这种能量被传感器捕获,传感器将一种形式的能量转换为另一种形式(即传感器将入射能量转换为电电压)。然后,电压信号被数字化,从而产生数字图像。为此,我们需要先进的技术和精确的校准,以确保我们能够准确地表示物理场景。在接下来的部分中,我们将探讨其中一些技术。
传感器技术及其在图像采集中的作用
如前所述,数字成像的第一步是传感器。为了创建二维图像,单个传感元件(如光电二极管)沿 x 和 y 轴移动。相比之下,更常见的传感器条带沿一个方向线性捕获图像。因此,为了获得完整的二维图像,这些条带垂直移动。这项技术常见于平板扫描仪等设备以及机载成像系统中。在更专业的应用中,如医学成像(例如,CT 扫描),使用环形配置的传感器条带。这些设置涉及复杂的重建高级算法,以将捕获的数据转换为有意义的图像。
传感器阵列,例如数码相机中的 CCD,由二维传感元件阵列组成。它们无需移动即可捕获完整的图像,因为每个元件都检测场景的一部分。这些阵列具有优势,因为它们不像单个传感元件和传感器条带那样需要移动来捕获图像。捕获的能量聚焦到传感器阵列上,转换为模拟信号,然后数字化以形成数字图像。
数字图像的形成与表示
数字图像形成的核心函数是,它由照明源和场景的反射率确定。

在基于透射的成像中,例如 X 射线,透射率取代了反射率。图像的数字表示本质上是一个数值矩阵或数组,每个数值对应一个像素。将连续图像数据转换为数字格式的过程是双重的
- 采样,将坐标值数字化。
- 量化,将幅度值转换为离散量。
数字图像的分辨率和质量在很大程度上取决于以下因素
- 使用的样本数量和离散强度级别。
- 成像系统的动态范围,即最大可测量强度与最小可检测强度之比。这在图像的外观和对比度中也起着关键作用。

数字成像中的分辨率理解
空间分辨率是指图像中可区分的最小细节,通常以每单位距离的线对或每单位距离的像素来衡量。空间分辨率的意义取决于上下文,并根据所使用的空间单位而变化。例如,2000 万像素的相机通常比 800 万像素的相机提供更高的细节分辨率。强度分辨率与可检测到的最小强度变化有关,通常受限于硬件的能力。它以二进制增量量化,例如 8 位或 256 级。对这些强度变化的感知受多种因素影响,包括噪声、饱和度以及人类视觉的能力。

图像恢复和重建技术
图像恢复着重于利用降级现象的知识来恢复降级图像。它通常涉及对降级过程进行建模,并应用逆过程来恢复原始图像。

相比之下,图像增强更为主观。它旨在改善图像的视觉外观。恢复技术包括处理噪声等问题,这些噪声可能在图像采集或传输过程中源自各种来源。在这种情况下,自适应和非自适应高级滤波器因其降噪能力而被使用。在医学成像中,特别是在计算机断层扫描(CT)中,从投影重建图像是一个关键应用。
图像处理中的色彩
颜色是图像处理中强大的描述符。它在目标识别和辨识中发挥作用。彩色图像处理包括伪彩色和全彩色处理。

伪彩色处理将颜色分配给灰度强度,而全彩色处理使用来自传感器的实际颜色数据。理解颜色的基础,包括人类颜色感知、色谱和色光的属性是关键。颜色的基础涉及人类视觉的三原色性质,即感知红色、绿色和蓝色。另一方面,颜色感知是我们眼睛中三种视锥细胞受刺激的方式。最后,色谱是电磁波谱中引起不同视觉感觉的波长范围。
不同的色彩模型,例如用于显示器和相机的 RGB 以及用于打印的 CMY/CMYK,在数字成像中标准化了色彩表示。在 RGB 色彩模型中,图像有三个分量(即通道),分别用于红色、绿色和蓝色。RGB 图像中的像素深度决定了可能的颜色数量,典型的全彩色图像具有 24 位深度(每个颜色分量 8 位)。这允许超过 1600 万种可能的颜色!RGB 色彩立方体表示该模型中可实现的颜色范围,灰度从黑色延伸到白色。

图像压缩
数据压缩减少了表示信息所需的数据量。它区分了数据(传递信息的手段)和信息本身。它针对冗余,即不相关或重复的数据。例如,10:1 的压缩比表示 90% 的数据冗余。
在数字图像压缩中,特别是二维强度数组,主要有三种冗余类型
- 编码冗余:编码冗余在图像中尤其普遍,其中强度值的分布并非均匀地分布在所有可能的值上,这表示为非均匀直方图。在此类图像中,某些强度值比其他值出现得更频繁,但自然二进制编码为每个强度值分配相同的位数,无论其频率如何。这意味着常见值并未比稀有值编码得更高效,导致位的使用效率低下,从而产生编码冗余。理想情况下,应该为更频繁的值分配较短的编码,为较不频繁的值分配较长的编码,以最小化使用的位数,这在非均匀直方图的自然二进制编码中并非如此。
- 空间和时间冗余:空间和时间冗余出现在图像内或视频帧间的相关像素值中。
- 无关信息:无关信息包括人类视觉系统忽略或对图像目的不必要的数据。
高效编码考虑事件概率,例如图像中的强度值。像游程编码这样的技术可以减少具有恒定强度线的图像中的空间冗余,从而显著压缩数据。类似地,可以解决视频序列中的时间冗余。然而,移除无关信息会导致量化,这是一种不可逆的量化信息损失。信息论,以及熵等概念,有助于确定准确图像表示所需的最小数据量。压缩后的图像质量通过客观保真度标准(输入和输出的数学函数)和主观保真度标准(人类评估)进行评估。
图像压缩系统使用编码器和解码器。编码器通过映射(减少空间/时间冗余)、量化(丢弃无关信息)和符号编码(为量化器输出分配代码)来消除冗余。解码器逆转这些过程,除了量化。图像文件格式、容器以及 JPEG 和 MPEG 等标准用于数据组织和存储。霍夫曼编码是消除编码冗余的一种著名方法,通过首先编码最不可能的源符号来创建高效表示。
< > 在 GitHub 上更新