Spectral–Spatial Weighted Kernel Manifold Embedded Distribution Alignment for Remote Sensing Image Classification光谱-空间加权核流形嵌入分布对齐
- 0.摘要
- 1.概述
- 2.相关工作
- 3.方法
-
- 3.1.空间过滤
- 3.2.嵌入流形
- 3.3.内核结构
- 3.4.分类器结构
- 4.实验
-
- 4.1.数据描述
- 4.2.实验设置
- 4.3.表现
- 5.结论
0.摘要
数据特征失真是遥感图像分类的典型问题,尤其是在迁移学习领域。此外,许多基于迁移学习的方法只关注光谱信息,而不使用遥感图像的空间信息。为了解决这些问题,我们提出了光谱空间加权核流形嵌入分布对齐(ssk - meda)遥感图像分类方法。该方法采用新型空间信息滤波器,有效利用附近样本像素的相似性,避免非样本像素的影响。然后,结合不同权重的空间核和光谱核进行审查,以适应平衡遥感图像光谱和空间信息的相对重要性。最后,我们利用流形空间中特征的几何结构来解决迁移学习场景中遥感数据的特征失真。SSWKMEDA它为迁移学习与遥感图像特征相结合提供了新的方法。大量实验表明,提出的方法比几种最新方法更有效。
1.概述
图像分类是遥感领域的重要研究方向;其目标是将每个像素分类为特定的表面对象[1]–[3]。它可以从标记的像素中受益。因此,当可以使用更多的标记像素时,可以获得更高的分类精度[4]和[5]。由于人工操作很难标记遥感图像,面对大量的遥感数据,学者们寻求自动化、高效的方法来完成这项工作。用新的分类器来处理想法。然而,遥感场景通常是由云和光等不同情况下获得的一系列图像拼接而成。因此,其中一个图像训练分类器不能直接用于其他图像。在用不同时间的两幅图像研究一个区域的变化时,也会发生类似的事情,当它们由不同的传感器产生时,差异可能会更大。 为了解决这个问题,我们考虑了一个转移学习设置,从源域的知识可以转移到目标域,以获得预测标签[6]和[7]。迁移学习是分类多时或多源遥感图像的有效途径 因此,迁移学习或领域适应(迁移学习的一种特殊形式)在研究界引起了广泛关注[8]–[10]。人们提出了各种迁移学习方法,并将其分为三类:1)基于实例的方法;2) 基于分类器的方法;3)基于特征的方法[11]–[13]。 基于实例的方法通常是。表现不佳的样品通常会根据不同的标准减轻重量,甚至会移除重量[14]和[15]。蒋和翟[16]试图从源域中删除性能差的样本,并根据两个域的条件分布增加目标域中标记样本的权重。Dai等人[17]提出了一个名字TradaBost该框架最初训练了一个基本的分类器,然后根据次迭代中根据分类错误重新加权源域样本。Persello[18]通过与同类目标域样本的平均余弦角相似性,重新加权每个源域样本。Long等人[19]、Y ang等人[20]和Peng等人[21]在源域转换矩阵上添加了等人[21]l1和l2范数项,以重新加权。Shi等人[22]利用概率分布和其他相邻样本重建每个样本。Li等人[23]提出了一个叫做迭代重加权异质迁移的学习(IRHTL)的框架。该方法用于根据源域样本与分离超平面的距离重新加权源域样本。 根据分类器的方法,将源域训练的分类器调整到目标域[24]和[25]。最常用的分类器是支持向量机(SVM)。Bruzzone和Prieto[26]由源域训练的最大似然分类器,可以更新参数以适应目标域。他们在[27]中介绍了另一项工作,最初是在源域训练SVM分类器。然后,为了提高分类器的自适应性,他们迭代添加源域中删除样本,以提高分类器的自适应性。Yang等人[28]提出自适应SVM(A-SVM),将SVM边界从源域调整到目标域,同时最大化类间的边界。郭等人[2 9]将ASVM扩展为时域A-SVM(TASVM),允许在任何地方定位每个域SVM。在随后的文章[30]中,他们初始化了多时相遥感图像SVM分类器,然后按时间顺序添加新图像,并使用TASVM微调分类器。Xu等人[31]提出了一种叫做带参数转移的域自适应方法,通过转移极端学习机的参数,将目标域分类器的参数与源域对齐。Rajan在源域训练分类器的基础上,等人[32]开发了一种新的分类器,利用二元级分类器获取其他区域或阶段图像的层次信息。 基于特征的方法也可以分为三类:1)利用域的分布来对齐域;2) 寻找共同的特征空间;或3)从所有特征中选择特征子集[33]–[35]。以下是对这三种方法的研究。对前者,。Pan等人[36]和Long等人[37]分别提出了转移成分分析(TCA)适应联合分布(JDA),它们使用核函数来解决边际分布和条件分布MMD。然后,Wang等人[38]引入流形嵌入分布对齐(MEDA)该方法利用结构风险最小化(SRM)和拉普拉斯正则化(LR)将JDA扩展到格拉斯曼流形空间[39]。与这些工作不同的是,Tuia等人[40]将质地对齐与图匹配联系起来,Ma等人[41]考虑整体质心对齐,类质心与协方差对齐。对于第二类,Frenando等人[42]提出子空间对齐(SA),它在两个域的主要成分分析(PCA)变换矩阵构建在子空间之间。基于此,Sun等人[43]将目标域PCA用偏小二乘相关子空间代替子空间。在另一篇文章中,Sun等人[44]通过最小化试图学习变换矩阵MMD将源域和目标域投影到公共稀疏空间,保留原始数据的方差。相反,Gong等人[45]视为域自适应Grassmann流形代表源域和目标域PCA几何流的积分在子空间的两点之间。此外,Sun等人[46]提出了一种简单但功能强大的方法,称为相关对齐(CORAL),目标域与传输源域之间的协方差对齐。对于最后一个,Persello和Bruzzone[47]用核方法测量特征与分类器的相关性和域不变性;然后,选择特征带。 然而,上述大多数方法都是在原始空间中实现迁移学习,特征扭曲可能发生在原始空间中,或者只使用单一的核心方法,这可能导致性能不理想。因此,消除特征失真并获得更好的性能对遥感图像来说是一个具有挑战性的问题。并非所有遥感图像的像素都可以视为样本。此外,这些样本像素与几何形状或纹理有关。然而,许多迁移学习方法只关注光谱信息,而不使用遥感图像的空间信息。因此,使用这些连接是遥感图像的另一个挑战性问题。 为了缓解这些问题,我们提出了一个名字。然后,我们平衡背景样本像素与原始样本像素之间的核权重。 我们的主要贡献总结如下:
- 提出了一种新型的空间信息滤波器,用于遥感图像分类,可以有效利用相邻样本像素的相似性,避免非样本像素的影响。
- 通过
空间核和谱核 我们构建了一个具有不同权重的相对重要性评估。 - 我们引入
Grassmann流形嵌入 ,遥感数据在迁移学习场景中的特征失真可以解决。
一般情况下,
2.相关工作
3.方法

图1:拟议SSWK-MEDA方法的流程图。
给定一个有m个样本的未标记域Xt={xti}mi=1,对其样本进行分类很困难,因为没有可用的标记信息。存在一个类似但不同的域Xs={xsi,Ysi}m+ni=m+1,有n个样本,具有相同类型的标记信息Y和Xt。我们的目标是找到一个分类器f,它可以使用来自源域Xs的知识来预测目标域Xt的标签。 拟议SSWK-MEDA方法的流程图如图1所示。源域和目标域图像最初通过空间滤波器获得其空间特征。然后,将光谱和空间特征分别投影到流形空间。然后,通过自适应加权光谱和空间流形特征的核来构造复合核。最后,可以通过总结SRM、动态分布对齐(DDA)和LR来学习分类器,LR利用数据样本之间的几何特性。为了获得相对较高的精度,可以对分类器进行T次迭代。
3.1.空间过滤
图2:像素示例。
对于l波段和C类的遥感图像Ispe,像素越近,通常越相似。然而,不同类别的像素可能彼此非常接近。在这种情况下,我们对Ispe中的所有样本像素应用一个k×k大小的窗口过滤器。对于每个频带中的每个采样像素,
3.2.嵌入流形
为了避免原始特征空间中的特征失真,我们使用
3.3.内核结构
核方法被广泛应用于迁移学习中,用于解决原始空间中线性不可分割的问题,如MMD。许多内核方法只使用一个内核。然而,一些研究证明,由
3.4.分类器构造
综合流形数据的SRM、DDA和拉普拉斯矩阵,分类器f可以表示为: 其中HK为核函数Kss诱导的希尔伯特空间,yi为第i个流形谱特征zspei的标记,||f||2k为f的平方模。前两项是SRM在源域的应用。
4.实验
4.1.数据描述
第一个数据集是grss_dfc_2013[24],[41],大小为349 × 1905,光谱范围为380-1050 nm,共有144个波段。它由美国国家机载激光测绘中心(NCALM)获得,覆盖休斯顿大学的一片区域,空间分辨率为2.5米。图像分为两部分,即亮部和暗部。亮部有4143个样品,暗部有824个样品。休斯顿数据集的图像和地面真实性如图3所示。尽管数据集有12个类,但只有4个类被这两个部分共享。因此,我们只使用了12个类中的4个。这些类别包括健康草、压力草、高速公路和铁路。为了方便起见,我们将此数据集命名为Houston数据集。 第二个数据集是印第安松树数据集[51]-[53],它是由美国国家航空航天局的机载可见光红外成像光谱仪(A VIRIS)传感器产生的。它包括145 × 145像素,覆盖375-2200 nm带宽的200个波段,空间分辨率为20 m。我们把它分为两个部分,即大的和小的部分。大零件有4966个样品,小零件有1446个样品。Indian Pines数据集的图像和地面真实性如图4所示。该实验使用了16个类中的7个,即玉米-薄荷,玉米,大豆-不耕,大豆-薄荷,燕麦,bldg-grass-树-drives和干草-windrowed。 第三个数据集由Worldview-2卫星获得,其空间分辨率为1.8 m[41]。我们称之为Worldview数据集。它包括来自武汉一个地区两个不同时期的两幅图像,即2011年图像和2012年图像。每个图像包含200 × 200像素。它是一个多光谱数据,包括8个波段(蓝、绿、黄、红、沿海、近红外、近红外和红边)。四类分别为:1)红色建筑;2)森林;3)灰色建筑;4)白色的建筑。图像2011有5317个样本,图像2012有5425个样本。Worldview数据集的图像和地面真值如图5所示。
4.2.实验设置
图3所示。(a)休斯顿数据集明亮部分的图像(R:50, G:30, B:20)。(b)休斯顿数据集阴影部分的图像(R:50, G:30, b:20)。©光明部分的地面真理。(d)阴影部分的地面真实性。
我们构建了“shadow→bright,” “bright→shadow,” “small→big,” “big→small,” “2011→2012,” and “2012→2011.”六个实验任务。在每个任务中,源域出现在“→”箭头之前,目标域出现在“→”箭头之后。每个任务的域属于同一个数据集。实验考虑了1-最近邻(1NN)、SVM、SA、GFK、TCA、JDA、CORAL和MEDA算法进行比较。综合准确率(OA)和kappa系数[22]、[54]、[55]作为评价指标。 为了获得目标域的软标签,我们训练了一个基于源域的1NN分类器。我们选择四个最近的点作为相邻点来计算矩阵W,可以达到很好的效果。选择的核函数为RBF核函数,其带宽由输入的方差决定。因此,流形光谱特征的RBF核的带宽由流形光谱特征的方差决定。流形空间特征的RBF核带宽由流形空间特征的方差决定。图6(a)清楚地表明,当T = 5时,大多数任务的准确性趋于收敛。因此,我们设置所有重复次数T为5。 **1)正则化参数:**为了评估正则化参数λ, η和ρ的灵敏度,我们运行SSWK-MEDA,它们的值从0.0001到8。为了方便起见,每个任务的相同正则化系数在所有迭代中都设置为相同的值。图6(b) - (d)中的结果表明,性能并不稳健。当η和ρ值较小时,其性能是稳健的。然而,λ的性能没有规律可循。因此,应根据实际应用对参数进行设置。 根据图6的结果,选择了这些参数的值。对于Houston数据集,流形子空间设为d = 60, λ = 1, η = 0.1, ρ = 4。对于Indian Pines数据集,这两个任务表现出了一些差异。因此,我们设d = 50, λ = 4, η = 0.0001,对于“大→小”,ρ = 0.001, λ = 0.1, η = 0.001,对于“小→大”,ρ = 0.0001。与Indian Pines数据集相似,Worldview数据集子集的两个任务的参数设置不同,分别为:“2011→2012”的d = 4, λ = 4, η = 0.001, ρ = 0.1;“2012→2011”的λ = 4, η = 0.01, ρ = 0.001。 SSWK-MEDA包括SRM、DDA和LR三个组件。在参数设置下,我们进行实验,分析SSWK-MEDA各成分的贡献。显然,表一所示的结果表明,这些组件在大多数任务中都是有效的。这些结果也表明我们需要根据实际情况设置参数。
4.3.表现
表一sswk-meda各分量分类精度
表二不同尺寸的窗口在不同数据集上的分类精度
表三预测α与可选α之间的误差
表iv oa(%)与1nn分类器在不同数据集上的分类准确率
表v oa (%) SVM分类器在不同数据集上的分类准确率
表vi kappa分类精度与1nn分类器在不同的目标集
表7 SVM分类器在不同数据集上的kappa分类精度
5.结论
本文提出了一种新的遥感图像分类方法——SSWKMEDA。swk - meda利用滤波器提取每个样本像素的相邻样本像素的平均光谱。将背景样本的核视为原始样本的另一个核,对它们进行自适应加权并集成到混合核中。因此,该方法允许利用空间信息来提高分类精度。该方法还可以利用流形嵌入数据的几何结构消除特征失真的影响。我们对高光谱数据和多光谱数据进行了多次实验。结果表明,无论是使用1NN分类器还是SVM分类器,我们的方法都比现有的方法更有效。未来的工作将集中在利用像素之间的其他关系,同时最小化分布的差异