高光谱成像中线性光谱混合模型LMM如何应用于复杂场景？

摘要：在上一篇中，我们介绍了 MF。在其推导过程中，我们对像素进行了如下建模： [mathbf{x} = alpha mathbf{s} + mathbf{b} ]当时，我们解释这种建模可以分离目标信号和背景信号，直

在上一篇中，我们介绍了 MF。在其推导过程中，我们对像素进行了如下建模： \[\mathbf{x} = \alpha \mathbf{s} + \mathbf{b} \] 当时，我们解释这种建模可以分离目标信号和背景信号，直观来看，这个公式的逻辑就是： \[像素光谱=目标光谱+其他干扰 \] 但是，这里还有一个我们一直没有展开的符号，那就是：\(\alpha\) 在上一篇中，我们将其解释为目标在该像素中的强度，那这个好像没什么存在感的系数是怎么来的？为什么感觉好像有没有都一样？显然，\(\alpha\) 并不是凭空出现的，它有着明确的物理和数学意义。要解释 \(\alpha\)，就要涉及到高光谱遥感中的一个非常重要的理论框架，那就是线性光谱混合模型（Linear Spectral Mixing Model, LMM）。 1. LMM 起源和地位 LMM 的起源可以追溯到高光谱遥感发展的早期阶段。1995 年，论文 Mapping Target Signatures via Partial Unmixing of AVIRIS Data 提出了部分解混（Partial Unmixing）的方法，引入了端元（Endmember）与丰度（Abundance）的概念，用于从混合像素中分离出目标光谱。这一方法奠定了现代高光谱影像分析中解混（Spectral Unmixing）的基础，并在目标检测、定量分析以及环境监测中得到广泛应用。随后，2002 年,论文 Spectral Unmixing 对光谱解混进行了系统总结，将 LMM 从早期实践经验上升为完整的理论框架，为现代高光谱分析提供了可解释、可量化且标准化的理论基础。即使在现在，LMM 仍然是高光谱分析中不可替代的主流工具，即便面对复杂非线性场景，它也常作为基线方法使用，同时为稀疏解混、深度学习解混网络以及 MF/ACE 等现代方法提供理论支撑。出现了很多没见过的词，下面，我们就来一一展开。 2. LMM 的核心思想结合物理常识，先从我们的生活中来举个例子：首先，光是会反射的，我们看到一朵红色的玫瑰，是因为玫瑰本身的材料主要反射红色光，这些反射光会进入我们的眼中，从而让我们看到玫瑰。但是，我们看到玫瑰是红色的，不代表反射进我们眼里的光全来自玫瑰。周围环境也会对我们看到的颜色产生影响：阳光的颜色、空气中悬浮的灰尘、旁边绿叶的反射光，都会混合进我们最终观察到的光线中。总结一下：我们眼中的光，是多种材料反射光的混合。我们的眼睛是这样，高光谱相机的镜头也是这样，可能某个像素看起来是植物，但其光谱特征其实是植物、土壤、水体的混合，只是植物所占比例更大而已。这就是 LMM 的核心思想：每个高光谱像素的光谱可以看作由若干“纯材料光谱”按一定比例线性叠加而成。基于这一理念，我们就可以使用数学方法把“混合光谱”进行“拆分”，这个过程就是上面提到的“解混”。由此，便衍生出端元和丰度两个概念： 2.1 端元（Endmember）所谓端元，指的是某一种材料在理想情况下的纯光谱特征。换句话说，如果一个像素只包含单一材料，那么该像素的光谱就可以看作这一材料的端元光谱。在遥感场景中，往往会出现很多材料，如植被、土壤、水体、混凝土、矿物等等，获取这些材料在各个波段上的反射率曲线，那么这些光谱就可以作为端元光谱。 2.2 丰度（Abundance) 丰度的概念也不难理解，如果说端元描述的是有哪些材料参与了混合，那么丰度描述的就是：每种材料在该像素中所占的比例或贡献程度。举个例子，假定某个像素的组成如下：材料丰度植被 0.6 土壤 0.3 阴影 0.1 这表示该像素中： 60% 的光谱来自植被、30% 来自土壤、10% 来自阴影。这里要说明一点：端元不仅限于物质材料，任何对像素光谱有系统贡献的因素（包括阴影、雪、湿度等）都可以作为端元。在实际应用中，丰度通常满足两个基本约束条件：非负约束：材料的比例不可能为负。和为一约束：所有材料的贡献比例加起来等于 1，也就是一个像素的全部组成。了解了端元和丰度两个基本概念后，我们便可以引出 LMM 的数学形式。 3. LMM 的表达式知道了端元和丰度的定义后，现在，每个像素的光谱就可以表示为端元光谱的线性组合。由此，我们得到 LMM 的表达式： \[\mathbf{x} = \sum_{i=1}^{p} \alpha_i \mathbf{s}_i + \mathbf{n} \] 其中： \(\mathbf{x}\) 表示像素光谱（观测到的混合光谱）； \(\mathbf{s}_i\) 表示第 \(i\) 个端元光谱； \(\alpha_i\) 表示第 \(i\) 个端元在该像素中的丰度； \(\mathbf{n}\) 表示设备噪声或其他未建模因素。你会发现，这个公式和 MF 中对像素的建模公式十分相似。实际上，MF 中的系数 \(\alpha\) 其实就是 LMM 的一个特殊情形。我们继续展开，解释其具体语义： 4. 从 LMM 到 MF 再回顾一下基本知识，在高光谱目标检测中，我们通常只关心：某一种特定目标是否存在。换成 LMM 的话说就是：我只关心某种特定的端元，其他都是背景。于是我们把所有其他材料通通合并为背景，就像这样： \[\mathbf{x} = \alpha_t \mathbf{s}_t + \sum_{i\ne t} \alpha_i \mathbf{s}_i + \mathbf{n} \] 其中， \(\mathbf{s}_t\) 就是目标光谱，\(\alpha_t\) 就是目标丰度，二者的组合就是我们的目标信号，而其他因素都是非目标信号。我们把所有非目标信号合并： \[\mathbf{b} = \sum_{i\ne t} \alpha_t\mathbf{s}_i + \mathbf{n} \] 模型就变成： \[\mathbf{x} = \alpha_t \mathbf{s}_t + \mathbf{b} \] 去掉角标，这就是 MF 的模型。因此：\(\alpha\) 本质上就是目标光谱在该像素中的丰度。现在，再回到最初的问题：为什么 \(\alpha\) 在 MF 中的存在感不高？再看一遍公式： \[\mathbf{x} = \alpha \mathbf{s} + \mathbf{b} \] 以最直观的数学逻辑来看，在这个式子里，我们已知观测光谱 \(\mathbf{x}\) 和参考光谱 \(\mathbf{s}\) ，希望求解背景干扰 \(\mathbf{b}\) 来进行后续操作。此时，最符合直觉的想法应该就是对观测光谱 \(\mathbf{x}\) 进行解混，通过其他方法求解目标端元的丰度，在通过运算得到未知量 \(\mathbf{b}\) 。但 MF 不同，它通过估计方法直接得到 \(\mathbf{b}\) 的统计特性，绕过了对 \(\mathbf{b}\) 本身的求解，自然也就绕过了与 \(\alpha\) 相关的解混逻辑。当然，MF 之所以不显式求解 \(\alpha\)，只是方法自身的特性，因为它关注的是“检测目标存在与否”，而不是每个像素的精确丰度。在更广泛的高光研究中，解混仍然是非常重要的步骤，这也是后续的介绍内容。

高光谱成像中线性光谱混合模型LMM如何应用于复杂场景？

相关推荐