高光谱成像中线性光谱混合模型LMM如何应用于复杂场景?

摘要:在上一篇中,我们介绍了 MF。在其推导过程中,我们对像素进行了如下建模: [mathbf{x} = alpha mathbf{s} + mathbf{b} ]当时,我们解释这种建模可以分离目标信号和背景信号,直
在上一篇中,我们介绍了 MF。在其推导过程中,我们对像素进行了如下建模: \[\mathbf{x} = \alpha \mathbf{s} + \mathbf{b} \] 当时,我们解释这种建模可以分离目标信号和背景信号,直观来看,这个公式的逻辑就是: \[像素光谱=目标光谱+其他干扰 \] 但是,这里还有一个我们一直没有展开的符号,那就是:\(\alpha\) 在上一篇中,我们将其解释为目标在该像素中的强度,那这个好像没什么存在感的系数是怎么来的?为什么感觉好像有没有都一样? 显然,\(\alpha\) 并不是凭空出现的,它有着明确的物理和数学意义。 要解释 \(\alpha\),就要涉及到高光谱遥感中的一个非常重要的理论框架,那就是线性光谱混合模型(Linear Spectral Mixing Model, LMM)。 1. LMM 起源和地位 LMM 的起源可以追溯到高光谱遥感发展的早期阶段。1995 年,论文 Mapping Target Signatures via Partial Unmixing of AVIRIS Data 提出了 部分解混(Partial Unmixing) 的方法,引入了 端元(Endmember) 与 丰度(Abundance) 的概念,用于从混合像素中分离出目标光谱。这一方法奠定了现代高光谱影像分析中 解混(Spectral Unmixing) 的基础,并在目标检测、定量分析以及环境监测中得到广泛应用。 随后,2002 年,论文 Spectral Unmixing 对光谱解混进行了系统总结,将 LMM 从早期实践经验上升为完整的理论框架,为现代高光谱分析提供了可解释、可量化且标准化的理论基础。 即使在现在,LMM 仍然是高光谱分析中不可替代的主流工具,即便面对复杂非线性场景,它也常作为基线方法使用,同时为稀疏解混、深度学习解混网络以及 MF/ACE 等现代方法提供理论支撑。 出现了很多没见过的词,下面,我们就来一一展开。 2. LMM 的核心思想 结合物理常识,先从我们的生活中来举个例子: 首先,光是会反射的,我们看到一朵红色的玫瑰,是因为玫瑰本身的材料主要反射红色光,这些反射光会进入我们的眼中,从而让我们看到玫瑰。 但是,我们看到玫瑰是红色的,不代表反射进我们眼里的光全来自玫瑰。周围环境也会对我们看到的颜色产生影响:阳光的颜色、空气中悬浮的灰尘、旁边绿叶的反射光,都会混合进我们最终观察到的光线中。 总结一下:我们眼中的光,是多种材料反射光的混合。 我们的眼睛是这样,高光谱相机的镜头也是这样,可能某个像素看起来是植物,但其光谱特征其实是植物、土壤、水体的混合,只是植物所占比例更大而已。 这就是 LMM 的核心思想: 每个高光谱像素的光谱可以看作由若干“纯材料光谱”按一定比例线性叠加而成。 基于这一理念,我们就可以使用数学方法把“混合光谱”进行“拆分”,这个过程就是上面提到的“解混”。由此,便衍生出端元和丰度两个概念: 2.1 端元(Endmember) 所谓端元,指的是某一种材料在理想情况下的纯光谱特征。换句话说,如果一个像素只包含单一材料,那么该像素的光谱就可以看作这一材料的端元光谱。 在遥感场景中,往往会出现很多材料,如植被、土壤、水体、混凝土、矿物等等,获取这些材料在各个波段上的反射率曲线,那么这些光谱就可以作为端元光谱。 2.2 丰度(Abundance) 丰度的概念也不难理解,如果说端元描述的是有哪些材料参与了混合,那么丰度描述的就是: 每种材料在该像素中所占的比例或贡献程度。 举个例子,假定某个像素的组成如下: 材料 丰度 植被 0.6 土壤 0.3 阴影 0.1 这表示该像素中: 60% 的光谱来自植被、30% 来自土壤、10% 来自阴影。 这里要说明一点:端元不仅限于物质材料,任何对像素光谱有系统贡献的因素(包括阴影、雪、湿度等)都可以作为端元。 在实际应用中,丰度通常满足两个基本约束条件: 非负约束:材料的比例不可能为负。 和为一约束:所有材料的贡献比例加起来等于 1,也就是一个像素的全部组成。 了解了端元和丰度两个基本概念后,我们便可以引出 LMM 的数学形式。 3. LMM 的表达式 知道了端元和丰度的定义后,现在,每个像素的光谱就可以表示为端元光谱的线性组合。 由此,我们得到 LMM 的表达式: \[\mathbf{x} = \sum_{i=1}^{p} \alpha_i \mathbf{s}_i + \mathbf{n} \] 其中: \(\mathbf{x}\) 表示像素光谱(观测到的混合光谱); \(\mathbf{s}_i\) 表示第 \(i\) 个端元光谱; \(\alpha_i\) 表示第 \(i\) 个端元在该像素中的丰度; \(\mathbf{n}\) 表示设备噪声或其他未建模因素。 你会发现,这个公式和 MF 中对像素的建模公式十分相似。 实际上,MF 中的系数 \(\alpha\) 其实就是 LMM 的一个特殊情形。 我们继续展开,解释其具体语义: 4. 从 LMM 到 MF 再回顾一下基本知识,在高光谱目标检测中,我们通常只关心:某一种特定目标是否存在。 换成 LMM 的话说就是:我只关心某种特定的端元,其他都是背景。 于是我们把所有其他材料通通合并为背景,就像这样: \[\mathbf{x} = \alpha_t \mathbf{s}_t + \sum_{i\ne t} \alpha_i \mathbf{s}_i + \mathbf{n} \] 其中, \(\mathbf{s}_t\) 就是目标光谱,\(\alpha_t\) 就是目标丰度,二者的组合就是我们的目标信号,而其他因素都是非目标信号。 我们把所有非目标信号合并: \[\mathbf{b} = \sum_{i\ne t} \alpha_t\mathbf{s}_i + \mathbf{n} \] 模型就变成: \[\mathbf{x} = \alpha_t \mathbf{s}_t + \mathbf{b} \] 去掉角标,这就是 MF 的模型。 因此:\(\alpha\) 本质上就是目标光谱在该像素中的丰度。 现在,再回到最初的问题:为什么 \(\alpha\) 在 MF 中的存在感不高? 再看一遍公式: \[\mathbf{x} = \alpha \mathbf{s} + \mathbf{b} \] 以最直观的数学逻辑来看,在这个式子里,我们已知观测光谱 \(\mathbf{x}\) 和参考光谱 \(\mathbf{s}\) ,希望求解背景干扰 \(\mathbf{b}\) 来进行后续操作。 此时,最符合直觉的想法应该就是对观测光谱 \(\mathbf{x}\) 进行解混,通过其他方法求解目标端元的丰度,在通过运算得到未知量 \(\mathbf{b}\) 。 但 MF 不同,它通过估计方法直接得到 \(\mathbf{b}\) 的统计特性,绕过了对 \(\mathbf{b}\) 本身的求解,自然也就绕过了与 \(\alpha\) 相关的解混逻辑。 当然,MF 之所以不显式求解 \(\alpha\),只是方法自身的特性,因为它关注的是“检测目标存在与否”,而不是每个像素的精确丰度。在更广泛的高光研究中,解混仍然是非常重要的步骤,这也是后续的介绍内容。