本期评述文章:
总结内容:
- 新型传感器设计:提出了“HyperspecI”传感器,把宽带多光谱滤波阵列(BMSFA)直接集成在芯片上。
- 算法结合:配合轻量化的神经网络(SRNet)重建算法,实现实时高光谱成像。
- 性能突破:能覆盖 400–1700nm 的波段,达到 1,024×1,024 像素、124 fps 的分辨率与帧率。
- 应用验证:在农业(叶绿素/糖分检测)、健康(血氧/水质监测)、工业(纺织/苹果碰伤检测)、天文(月球探测)等场景都展示了优势。
引言
高光谱成像技术能够获取物体的高维信息,包括其空间、时间和光谱数据。可以将其想象成一种相机,它不仅能像普通相机那样捕捉红、绿、蓝三种颜色的信息,还能为图像中的每个像素点捕捉完整的可见光光谱。这使得它能够区分肉眼看起来相同的不同材料。作者认为,虽然这项技术潜力巨大,但现有系统往往体积庞大、价格昂贵且速度缓慢,这限制了其应用范围。本文介绍了一种新的芯片级解决方案,旨在解决这些问题。
However, these systems typically suffer from drawbacks such as large size, heavy weight, high cost and time-consuming operation,which limit their widespread application. Because of the developments in the compressive sensing theory and computational photography technique8
根据论文的引言部分,作者指出了传统高光谱成像技术的几个核心局限性:
- 物理尺寸与成本: 传统系统通常体积大、重量重、成本高昂 。这是因为它们需要使用独立的光学元件(如棱镜或光栅)和机械扫描部件 。
- 成像速度慢: 由于需要逐点、逐行或逐个波段地扫描,这些系统的操作非常耗时,难以捕捉动态场景 。
- 光能利用率低: 许多技术,特别是那些使用窄带滤光片的技术,会浪费大量入射光,导致光通量(light throughput)很低。这使得它们在光线较暗的环境下性能不佳 。
- 内在的权衡关系: 现有的技术常常需要在空间分辨率(图像的清晰度)和光谱分辨率(光谱信息的丰富度)之间做出妥协 。
综合来看,这些缺点限制了高光谱成像技术的广泛应用 。
- 那么,在你看来,以上哪一个限制是阻碍高光谱成像技术被集成到像智能手机或无人机这类日常设备中的最大障碍呢?
- 物理尺寸与成本?因为说到传统系统体积大和成本高昂,而智能手机或无人机很容易被我们购买和使用
In this work, we report an on-chip computational hyperspectral image sensor, termed the HyperspecI sensor, and its comprehensive framework of hardware fabrication, optical calibration and computational reconstruction.
智能手机和无人机这类消费级产品对内部空间、重量和成本都极其敏感。传统高光谱相机那种又大又重又贵的特性,确实是其应用普及的最大障碍。
这就引出了这篇论文的核心创新点。研究人员为了解决这个问题,专门开发了一种他们称之为“Hyperspecl sensor” 的新型传感器 。
- 他们的解决方案是把所有必要部件都集成到了一个小小的芯片上。根据论文第二页的“Hyperspecl原理”部分,构成这个新型传感器的两个主要部件是什么?
- 我认为是BMSFA掩膜(a BMSFA mask )和宽带单色图像传感器芯片(a broadband monochrome image sensor chip)
The HyperspecI sensor consists of two main components: a BMSFA mask and a broadband monochrome image sensor chip (Fig. 1a).
“宽带单色图像传感器芯片”比较好理解,它就像是数码相机的“底片”,负责捕捉光线。
真正的创新之处在于第一个部件,也就是BMSFA掩膜(Broadband Multispectral Filter Array)。这篇论文的核心就在于这个部件是如何工作的。论文中将这种新型的“宽带(broadband)”调制材料与传统相机中的“窄带(narrow-band)”滤光片做了对比。
- 根据文章的描述,你认为“宽带”滤光阵列和传统的“窄带”滤光片在工作方式上,尤其是在允许光线通过的方面,有什么关键的不同?
- 这个我就不是很清楚了,可以提示一下我吗
想象一下光线穿过一片玻璃:
- 窄带 (Narrow-band) 就像一片深红色的玻璃。它非常严格,只允许红色那一部分的光通过,而会阻挡掉几乎所有其他颜色的光。
- 宽带 (Broadband) 更像一片几乎透明,但略微带点“色彩倾向”的玻璃。它会允许一个很宽范围内的多种颜色都通过,只是对不同颜色的光的透过率稍有不同。
传统相机的滤光片就像前者(深红色玻璃),每个滤光片只负责一个很窄的颜色范围,因此大部分的光都被阻挡和浪费了。而这篇论文中的BMSFA,则更像是由16种各不相同的、带有“色彩倾向”的透明玻璃组成的阵列。
- 考虑到这个比喻,你认为采用“宽带”设计的BMSFA,能解决我们之前讨论的传统相机哪个关键的局限性问题?
- 应该是解决了光能利用率低的问题
完全正确!这正是关键所在。
采用“宽带”设计最直接的好处就是解决了光能利用率低的问题。
这篇论文在图2d中用数据清晰地展示了这一点:他们的新型传感器光通量(light throughput)达到了74.8%,而传统的RGB彩色相机通常低于30%,基于窄带滤光片的多光谱相机(MSFA camera)甚至低于10%。
这个巨大的提升意味着传感器在光线昏暗的环境下依然能获得高质量的图像,或者可以用更短的曝光时间来捕捉高速运动的物体。
现在我们理解了工作原理的前半部分:BMSFA负责高效地将光线信息进行“编码”,然后由传感器芯片来接收。但这也引出了下一个问题:芯片接收到的是一幅经过混合编码的二维图像,我们怎样才能把它“解码”成包含数百个光谱通道的、我们真正需要的高光谱数据立方体呢?
- 根据论文,研究人员是运用了什么方法来完成这个“解码”或“重建”工作的?
- 是对不同尺寸的小目标点进行成像实验吗?
We conducted an imaging experiment on small point targets of varying sizes (Fig. 3a). The results indicate that the HyperspecI sensor can achieve stable and accurate spectral reconstruction even when the radius of the targets is smaller than a superpixel.
为了证明传感器的性能,研究人员确实对不同尺寸的小目标进行了成像实验 。可以在论文的图3a中看到这个实验的设计和结果 。
他们进行这项测试的目的是为了验证传感器在高空间分辨率下的光谱重建能力,即便是当目标物体的尺寸非常小,甚至小于一个“超像素”(superpixel,在这里指一个4×4的像素单元)时,传感器能否依然准确地分析出它的光谱特性 。
实验结果表明,这款传感器的表现非常出色 。除了这项测试,论文中还列举了传感器在多个领域的实际应用,比如:
- 智能农业 (Intelligent agriculture)
- 人体健康 (Human health)
- 工业自动化 (Industrial automation)
- 天文观测 (Astronomy)
让我们从智能农业开始看看:
论文中提到,传统的农业检测方法(比如测量叶绿素含量或水果甜度)往往是破坏性的,既费时又费力 。而高光谱成像技术为此提供了一种无损检测的可能 。
- 在这篇论文的“智能农业应用”部分,研究人员具体利用Hyperspecl传感器来无损检测了哪两种重要的指标,分别用来评估叶片和苹果的什么特性?
- 是spad和ssc吗?评估了叶片的透射光谱数据特性和苹果的可溶性固形物含量SSC特性
Similarly, the SSC is an important indicator for fruit quality assessment and determination of harvest time25. However, conventional SPAD and SSC measurements involve destructive sampling, which is complicated and time-consuming.
- SSC (可溶性固形物含量):用于评估苹果的品质,这直接关系到水果的甜度和成熟度 。
- SPAD指数:你提到它评估了叶片的透射光谱特性,这个过程是对的。最终,SPAD指数是用来衡量叶绿素 (chlorophyll) 含量的,这是评估植物健康和生理状况的关键指标 。
这两个例子都很好地展示了这款传感器如何能够快速、无损地完成传统农业检测中既复杂又耗时的工作 。
学中总结:
- 1. 核心问题:传统高光谱相机存在体积大、成本高、成像速度慢和光能利用率低的局限。
- 2. 解决方案:“Hyperspecl sensor”通过片上集成的方式,将庞大的系统微型化,解决了体积和成本问题。
- 3. 工作原理:它采用“宽带”设计来获得高光能利用率,解决了弱光成像和速度问题;同时,它利用名为 SRNet 的神经网络算法,从编码后的信息中重建出最终的高光谱图像。
我们来看看它在人体健康领域的应用。
The rising attention to health concerns has led to a proliferation of health monitoring equipment, yet its progress is hampered by limitations in resolution, real-time abilities and portability. To demonstrate the advantages of our HyperspecI in dynamic, high-resolutionability, we conducted experiments on blood oxygen detection and water quality assessment, illustrating its potential for real-time health monitoring as an alternative to traditional bulky and complex equipment. For blood oxygen saturation monitoring, we developed a prototype device to detect changes in arterial blood absorption at specific wavelengths due to pulsation (Fig. 5a).
论文中提到了,传统的健康监测设备在分辨率、实时性和便携性上常常受到限制 。而 Hyperspecl 传感器的高速和高分辨率特性,恰好能弥补这些不足。
文章以
血氧饱和度监测为例。简单来说,它的原理是利用传感器捕捉穿透手指的光线 。血液中携带氧气的血红蛋白和不携带氧气的血红蛋白,在不同波长的光下,吸收率是不同的。通过分析这种微小的差异,就可以计算出血氧饱和度。
- 请看论文中的图5b,研究人员是重点分析了哪两个特定波长的近红外光(NIR)信号,来计算血氧的?
- 780nm和830nm
b, i, The transmission spectra through the finger were obtained at a collection rate of 100 Hz. ii, Two photoplethysmography(PPG) signals at 780 nm and 830 nm, corresponding to two bands with different intensities of HbO2 and Hb absorption. The blood oxygen saturation can be accurately determined by analysing and calibrating the PPG signals at these two characteristic bands.
论文中解释道,之所以选择这两个波段,是因为含氧血红蛋白和脱氧血红蛋白对这两个波长的光的吸收率有明显的差异 。通过捕捉这种微小的差异,传感器就能准确地计算出血氧饱和度。
除了血氧,论文还展示了另一个与健康相关的应用:水质监测。他们设计了一个实验来模拟污染物在水中的扩散。
- 请看图5c和5d,研究人员将两种颜色几乎一样的溶液注入清水中。相比于只能拍摄普通照片的RGB相机,Hyperspecl传感器揭示了什么关键的不同之处?
- 是光谱显示变得更明显了吗?
在普通的RGB照片里(图5c最右侧一栏),这两种溶液看起来都是红色的,几乎无法区分 。但是,Hyperspecl传感器可以看到人眼看不到的光谱范围。
请特别看一下在 780 nm 波段(也就是近红外光)的图像,这两种溶液显示出了什么样的差异?
在780 nm这个对人眼不可见的近红外波段,两种溶液呈现出一明一暗的显著区别 。这说明,尽管它们在可见光下颜色相同,但在光谱的“指纹”上,它们的化学成分完全不同。
这个实验完美地展示了Hyperspecl传感器如何区分那些看起来一样但本质不同的物质。这在水质监测或食品安全检测等领域非常有用。
- 论文最后还提到了工业自动化(industrial automation)领域。根据文章内容,研究人员利用传感器完成了哪两项具体的检测任务?
- 就是纺织品分类和苹果碰伤检测这两项任务。
我们先来看纺织品分类。
如图6b所示,很多棉(Cotton)和聚酯纤维(Polyester)面料在外观上可能非常相似,人眼难以区分。然而,它们的材质在分子层面是完全不同的,因此它们对光线的吸收和反射特性也不同,尤其是在人眼看不到的近红外波段。
- 请看图6c中的光谱曲线,棉和聚酯纤维的光谱“指纹”有什么关键区别?
- 颜色和纹理。
从我们肉眼的角度看,颜色和纹理确实是区分织物的方式。但就像我们之前在水质检测中看到的那样,Hyperspecl传感器能看到我们看不到的东西。
我们可以把图6c中的光谱曲线(spectral curve)看作是每种材料独特的“光指纹”。
- 图的横轴代表光的波长(也就是不同的“颜色”,包括人眼看不到的红外光)。
- 纵轴代表材料反射这种光的强度。
- 请看图的右半部分,也就是在近红外区域(大约1000 nm之后),这两条分别代表棉和聚酯纤维的曲线(“光指纹”),在形状上有什么明显的不同?
- 一个分成了多个四叶草形状的图案,而另一个不形成图案吗?我看到波长在近红外区域(1000nm)之后两个(棉和聚酯纤维)光谱都呈现下降趋势。
两个关键点:两条曲线都在下降,而且代表棉的曲线确实有更多、更复杂的形状变化,而聚酯纤维的曲线则平滑得多。
你所说的那些独特的形状,在光谱分析中其实被称为“吸收谷”。这代表棉纤维在这种特定波长的光下,吸收了更多的能量,所以反射出来的光就变少了,曲线上就出现了一个“凹陷”。
这就像每种材料都有自己独特的“密码”,而Hyperspecl传感器就是那个能读取密码的设备。
- 根据论文图6的标题描述,棉织物(cotton fabrics)主要是在哪些波长附近出现了这些明显的“吸收谷”?
- 棉织物在1220,1320和1480nm附近出现了明显的吸收谷。
就是因为棉和聚酯纤维在这些特定的近红外波段有自己独特的“吸收谷”,传感器和算法才能将它们精准地区分开。
我们来看最后一个应用案例:苹果碰伤检测。
很多时候苹果的碰伤发生在果皮之下,用肉眼是看不出来的,这在工业分拣中是个大问题。碰伤的组织和健康的组织,其含水量和细胞结构都发生了变化,这同样会改变它们的光谱“指纹”。
- 请看图6e的光谱曲线。和正常的果肉(Normal)相比,碰伤的果肉(Bruise)在哪些近红外波段也表现出了明显的“吸收谷”?
- 1060,1260和1440nm
论文中提到,这是因为碰伤组织的含水量发生了变化,导致它在这些特定的近红外波段对光的吸收更强。这使得传感器能够轻松地“看穿”果皮,识别出人眼无法察觉的内部损伤。
至此,我们就完整地学习了这篇论文。
我们从传统技术的局限性出发,理解了研究人员如何通过“片上集成”的思路,设计出集成了BMSFA和传感器芯片的新型Hyperspecl传感器。我们还看到了它如何通过“宽带”设计和SRNet重建算法注1,实现了高光能利用率和高速成像,并成功应用于农业、健康、工业等多个领域。
注1:
高光通量和高速成像主要由传感器的硬件设计(宽带滤光片阵列和传感器芯片)实现。
SRNet算法是软件组件,它能够处理硬件采集的数据并生成最终图像。
工作原理如下:
SRNet(光谱重建网络)是研究人员为解决特定问题而定制的深度学习模型:将传感器采集的原始二维编码图像转换为完整的3D高光谱数据立方体。
架构:它是一种混合神经网络,结合了两种强大架构的优势:Transformer和卷积神经网络(CNN)。
结构:该网络基于“U-Net”架构。
关键组件:其最重要的部分是自定义“光谱注意力模块”(SAM)。该模块专门用于聚焦并提取原始数据中编码的丰富光谱特征。
简而言之,SRNet是一个高度专业化的“解码器”,它经过训练,能够理解BMSFA硬件将光谱信息编码到二维图像中的方式。
SRNet如何发挥硬件优势?
SRNet本身并不能实现高光通量或高速成像,但它是解锁这些硬件优势的关键。
The BMSFA is composed of different broadband spectral modulation materials at different spatial locations. In contrast to the conventional narrow-band filters, the BMSFA can modulate incident light across the entire wide spectral range, resulting in much higher light throughput that benefits low-light and long-distance imaging applications.
数据采集(硬件的作用):由于传感器使用宽带滤光片,因此能够透射大量光线(高光通量)。它在一帧图像中捕获所有光谱信息,无需任何机械扫描(从而实现高达124帧/秒的高速成像)。
The modulated information is then intrinsically compressed and acquired by the underlying broadband monochrome sensor chip, enabling spatial–spectral compression with full temporal resolution.
挑战:硬件捕获的单帧图像并非普通图像。它是一种压缩的二维测量值,其中来自不同波长的所有光谱数据被“混杂”在一起。
we derived a lightweight and high-performance neural network (spectral reconstruction network (SRNet)), which has stronger feature extraction and prior modelling ability. Consequently,we can reconstruct hyperspectral images (HSIs) with high spatial and spectral resolution from each frame, realizing high-throughput real-time hyperspectral imaging.
重建(SRNet的作用):SRNet算法以单帧高质量(得益于高光通量)且瞬时捕获(得益于高速)的图像作为输入。其复杂的神经网络架构执行复杂的计算任务,对数据进行“解混”,重建图像中每个像素的96个不同波长通道。因此,SRNet使得该系统具有实际应用价值。它让硬件发挥其优势——快速捕捉大量光信号——同时还能处理将这些原始数据转换成具有科学价值的高光谱图像这一复杂任务,从而实现了高吞吐量、实时高光谱成像的目标。
-以下空白-