TGRS2022/云检测:Unsupervised Domain Adaptation for Cloud Detection Based on Grouped Features Alignment and Entropy Minimization无监督域自适应基于分组特征对齐和熵最小化的云检测
- 0.摘要
- 1.概述
- 2.方法
-
- 2.1.拟议的UDA框架
- 2.2.GFA域自适应
- 2.3.EM域自适应
- 2.4.网络优化学习
- 3.实验
-
- 3.1.实验设置
- 3.2.消融实验
- 3.3.与最新方法的比较
论文下载 开源代码
0.摘要
大多基于卷积神经网络(CNN)基于监督学习框架的云检测方法,需要大量像素级标签。然而,手动注释海量遥感图像的像素标签既昂贵又耗时。为了降低标记成本,我们提出了无监督域自适应(UDA)该方法将源卫星标记图像上训练的模型推广到目标卫星的未标记图像。为了有效地解决跨卫星图像的域偏移问题,我们开发了一种基于分组特征的新型对齐(GFA)和熵最小化(EM)的UDA为了提高跨卫星图像的云检测精度,提取域不变表示。拟议的UDA方法在“Landsat-8→ ZY-3”“和”GF-1→ ZY-评估了域适应任务。实验结果证明了我们的方法对现有最先进UDA方法的有效性。
1.概述
随着遥感技术的发展,世界上发射了大量用于地球观测的光学遥感卫星。不幸的是,大约66%的地球表面被云覆盖[1],这导致光学卫星传感器获得的大多数遥感图像被云污染。云污染的遥感图像被视为低质量产品,严重干扰了土地覆盖分类[2]、图像匹配[3]、目标检测[4]、三维曲面生成[5]等图像分析任务。因此,云检测是评估遥感图像质量的重要预处理步骤[6]。 近年来,深度卷积神经网络(DCNN)该方法已广泛应用于遥感图像的云检测。提出了许多有效的云检测方法,如基于超像素的分类方法[7]-[9]和基于端到端语义的分类方法[10]-[12]。这些基于CNN的云检测方法大多基于监督框架,该框架严重依赖于具有图像级[7]-[9]或强像素注释[10]-[12]的大量训练数据。 然而,标签标签是一项艰巨的任务,需要专家级的人类知识,特别是大量的遥感图像,既昂贵又耗时。在我们之前ZY-在云覆盖估计的工作[6]和[13]中,我们仍然站在有监督的工作中CNN云检测在框架上进行。手动标记ZY-3缩略图的云掩码非常繁琐耗时。从大小为1k×1k红、绿、蓝(RGB)在场景缩略图中标记像素通常需要1-2个小时。因此,迫切需要使用无监督的学习方法来减少人工标记数据集的工作量。 克服这一限制的有效方法之一是利用转移学习策略将知识从标记数据集转移到未标记数据集[14]。然而,由于分辨率和频谱的差异,以及跨卫星遥感图像之间的土地覆盖类型的差异,基于源卫星标记数据的训练CNN目标卫星图像很难推广模型。近年来,提出了无监督域自适应(UDA)解决源域(标记数据集)与目标域(未标记数据集)之间的域转移问题[15]-[17]是转移学习的一种特殊情况。基于对抗学习UDA已被证明是通过源域和目标域之间的分布对齐来解决域转移问题的有效方法[18]。基于对抗学习UDA学习域识别器的关键思想是区分源域数据和目标域数据的特征,从而帮助语义分割模型表达学习域的不变特征,从而混淆域识别器[19]。UDA可在输入级(像素级)[20]、特征级[21]或输出级[14]、[16]、[17]等不同表示层上实现方法的分布对齐。这些UDA该方法在合成中取得了良好的性能→ 真实案例 然而,只有少数作品关注遥感图像,特别是跨卫星遥感图像。基于遥感图像分割UDA大多数工作,如[22]、[23]和[24],都使用样式转换方法[25]生成虚假源域,其中数据视觉外观与目标域相似。换句话说,这些方法侧重于原始输入水平,而不是特征和输出水平。此外,这些方法还对土地覆盖数量有限的数据集进行了评估。由于全球地貌特征不同,采集的卫星图像中有多个子域。如图1所示,同一颗卫星在不同的地方获得ZY-图像显示了不同的颜色、云类型和土地覆盖类型。因此,由于源域和目标域的子域复杂多样,仅基于样式转换方法与输入级分布对齐可能不是最好的。考虑到跨卫星图像语义信息的一致性,特征级或输出级域对齐可能是减少源与目标卫星数据域之间域差距的有希望途径。 本文主要采用UDA该方法将知识从标记的云评估数据集转移到未标记的云评估数据集ZY-3数据集。换句话说,我们的目标是从源标记的域卫星数据集中学习云检测模型ZY-3数据集表现良好。为了减少源与目标卫星数据域之间的域差,如图2所示,我们提出了基于特征和输出级对齐策略的有效性UDA用于跨卫星遥感图像云检测的框架。与以往基于整体特征的对齐(HFA)域适应[18]和[21]的特征级对齐策略不同,我们提出了一种分组特征对齐(GFA),将中间特征映射分为不同的组,并应用基于对抗学习的域适应来对齐源数据和目标数据之间的特征映射。另外,我们没有使用熵最小化(EM)[16],[26]作为减少域偏移的主要域适应策略,而是引入输出级别EM加权自信息图作为辅助域适应策略,在源域和目标域之间对齐输出预测,显著提高了目标数据集中源域数据培训模型的泛化能力。 本工作的主要贡献总结如下。
- 我们提出了有效的建议UDA该框架具有云检测目标卫星遥感图像的特征和输出级对齐策略。
- 我们提出了一个GFA域自适应法有效地减少了源域与目标域之间的特征分布距离,以获得域不变的特征。
- 我们引入了EM目标是有效地实现高预测确定性(低熵),以弥合输出级别与目标数据集之间的域差。
2.方法
2.1.拟议的UDA框架
如图2所示。提出基于UDA跨卫星遥感图像云检测框架。GFA该策略通过使用对抗学习策略,有效地减少了网络多个中间层与目标特征分布之间的距离。此外,我们使用对抗训练来增强加权自信息映射Ix一致性。源域采用红色箭头,目标域采用绿色箭头。最佳观赏颜色。
由于区域差异,如图像分辨率、云高动态范围和背景土地覆盖类型,基于源域训练CNN目标域很难概括。本文采用域自适应策略,减少源与目标卫星图像的域差。受Hoffman等人[15]、Tuan Hung等人[16]和Tsai在等人[17]的启发下,我们开发了一种跨卫星图像云检测UDA方法。如图2所示,我们的UDA框架在特征级别和输出级别上实施域对齐,鼓励在源域上训练的语义分割网络很好地推广到目标域。源域和目标域样本在正向传播过程中通过共享分割网络。 具体来说,我们提出了一个GFA实施域自适应的策略。如图2所示,。为了有效地对齐特征,分割网络。此外,最先进的方法验证了实施[16]、[26]和[27]进一步促进我们开发有效的输出预测自适应方法,以提高目标图像上的云检测精度。本文介绍了为了进一步完善我们模型的泛化。
图3所示。提出云检测GFA和EM域适应:(a)未经训练的模型源和目标域场景结果;(b)和?分别用HFA和GFA自适应训练模型对同一目标域场景的结果;(d)使用GFA和EM在一目标场景中自适应训练模型的结果。
图3中的结果表明,应用域自适应后,预测的准确性显著提高。如图3所示(b)和(c)所示,拟议GFA与传统相比,域自适应HFA域自适应更有效[15]和[21]。然而,检测结果中仍有大量误分类像素。添加输出级EM域自适应后,云检测结果进一步改善,如图3所示(d)所示。 由于目标图像上预测结果的熵图与源图像上的熵图相似,。
2.2.GFA域自适应
最近,基于特征对齐的方法在遥感图像分类中取得了巨大的成功[28]和[29]。然而,跨卫星遥感图像语义分割的特征级对齐仍然具有挑战性,因为图像分辨率、频谱差异和较大的外观差距。受分组卷积[30]-[32]和分组注意块[33]的启发GFA以有效最小化源与目标特征域分布之间的距离为策略。如图2所示,我们将中间特征图分为一系列组,并在源数据和目标数据之间使用对抗性学习策略。形式上,给定两个特征映射,源域特征映射Fks∈ RW×H×C与目标域特征映射Fkt∈ R×H×C是从分割网络的。
-
特征图分组:为了有效地对齐特征,我们首先沿通道维度将这两个特征图拆分为一系列子特征图 其中R=1,2,4…2n为特征映射组的数量,f(k,r)s∈ RW×H×(C/R)和f(k,R)t∈ RW×H×(C/R)分别表示从。然后,使用域对抗训练策略将特征对齐应用于这些分组特征图。
-
特征图对齐:基于对抗式学习的UDA已被证明是解决域转移的有效方法[18]。在对抗学习框架下,我们将UDA任务表述为分组特征映射空间中源和目标之间分布距离的最小化。为此,我们设计了一个标准的二进制分类网络作为鉴别器Dfma。形式上,给定两个输入分组子特征映射f(k,r)s和f(k,R)t,我们最小化交叉熵域分类损失[34]来训练鉴别器D(k,r)fma。目标函数定义如下: 同时,训练分割网络的对抗目标定义如下 其中,LadvD(k,r)fma表示从第k中间层提取的目标特征图的rth分组子特征图的对抗目标。最重要的是,LadvD(k,r)fma用于混淆子分类器D(k,r)fma,以鼓励分割网络G生成域不变特征。第k中间层的GFA损失定义为所有分组子特征图的对抗性损失总和
2.3.EM域自适应
如图3(c)所示,在多个中间层应用GFA域自适应后,目标图像上模型的预测结果显著改善。然而,在预测的地图中仍然存在许多错误分类的像素。为了进一步提高源训练模型的泛化性能,受到Tuan Hung等人[16]Tsai等人[26]和Pan等人[27]的启发,我们引入EM策略来缓解域差异。
- 加权自信息映射:如图3所示,在没有EM域自适应的情况下,在源域图像上训练的分割网络往往会分别输出源图像和目标图像的过度自信(低熵)和欠自信(高熵)预测。因此,我们使用对抗性训练框架,通过强制执行与源域相似的目标域的熵分布来进行输出级域自适应。与[16]类似,我们在加权自信息图Isx,Itx∈ RH×W×C上执行对抗性适应,定义如下: 其中,Psx(w,h,c)和Ptx(w,h,c)是在共通道位置(w,h)处的源图像和目标图像的预测分数。方程(6)和(7)可以被视为香农熵[16]的解纠缠,其定义为:
- 自信息图的对齐:与GFA类似,我们使用对抗训练框架进行输出级域适应。用于加权自信息地图对齐的鉴别器具有与GFAs中使用的鉴别器相同的结构。在域对抗训练中,我们还最小化交叉熵域分类损失[34],以训练鉴别器Dem。目标函数定义如下: 此外,训练分割网络的对抗目标是
2.4.网络优化学习
如图2所示,我们对分割网络G有两个输入数据集,即有标记的源域数据集Xs = {(xsi, ysi)}Nsi=1,无标记的目标域数据集Xt = {(xtj, ytj)}Ntj=1,其中xsi和xti分别代表源样本和目标样本,ysi是xsi的关联标签。在训练过程中,分割网络首先使用标记图像xsi进行训练,并通过标准的交叉熵损失进行监督 式中psi = G(xsi)为预测结果。当我们将未标记的目标图像xti转发到分割网络G时,它由多个GFA损失{Lkgfa}Kk=1和一个EM对抗性损失LadvDem监督。因此,分割网络G的最终训练目标LG定义如下: 其中λgfa和λem为使目标LG最小的权值。 此外,目标样本不仅用于训练分割网络G,还用于最小化目标{LD(k,r)fma}K,Rk=1,r=1和LDem分别训练{D(k,r)fma}K,Rk=1,r=1和Dem,以实现域适应。
3.实验
3.1.实验设置
生成模型中,我们使用DeepLabv2[37]作为我们的主云检测框架,采用ResNet-101[38]作为骨干架构,提取包含语义信息的高级特征。DeepLabv2使用了atrous空间金字塔池化(ASPP)模块[37],该模块融合了多个不同采样率的并行扩展卷积层[39],以捕获多尺度特征图,用于鲁棒云检测。预测的概率映射为输入图像的1/8 × 1/8 s,并直接上采样到与输入图像相同的大小,从而得到最终的预测结果。 对于判别模型,我们设计了一个标准的二值分类网络作为判别器来对齐源样本和目标样本之间的特征映射和加权自信息映射。所设计的鉴别器的详细结构如图4所示。有4个卷积层,4 × 4核,{256,192,128,64}通道。每个卷积层拥有相同的步幅(步幅= 2),并同时被一个泄漏纠正线性单元(ReLU)激活(斜率= 0.2)和一个dropout层(dropout rate = 0.5)跟随。通过卷积运算,设计一个全局平均池化层和一个全连接层来获得置信度得分。
我们提出的UDA框架是在搭载NVIDIA GTX 1080 Ti GPU的Ubuntu 14.04操作系统下的Pytorch框架上训练的。采用随机梯度下降(SGD)算法[40]对发电机网络进行优化。生成器网络和鉴别器网络的学习率分别为2.5 × 10−4和1.0 × 10−4。所有网络的训练衰减策略都是“poly”[41]。小批量大小、动量和重量衰减数分别为4、0.9和5 × 10−4。为了提高性能,我们使用在ImageNet数据集[42]上预训练的模型来微调骨干网(ResNet-101)的参数。 在训练过程中,我们对“Landsat-8→ZY -3”域适应任务设置λgfa = 0.001, λem = 0.01, R = 4,而对“Gf-1→ZY -3”域适应任务设置λgfa = 0.0005, λem = 0.01, R = 2。对于所有的域适应任务,即K = 2,我们分别在RestNet-101的Conv4_x层和Conv5_x层的末端特征映射上应用GFA域适应。在“Landsat8→ZY -3”和“GF-1→ZY -3”域适应任务上分别进行60k和40k迭代训练。
3.2.消融实验
3.3.与最新方法的比较