资讯详情

自监督论文阅读笔记 Self-supervised Learning in Remote Sensing: A Review

深度神经网络其优点导致了计算机视觉、自然语言处理、自动语音识别和时间序列分析的重大突破。然而,深度神经网络的性能。因此,在过去的十年里,监督训练生成了多个注释数据集(例如ImageNet [2]),促进了许多领域的进步。不幸的是,。监督学习范式的这种限制严重阻碍了深度学习在现实世界场景中的适用性。

事实上,已经研究了许多普通监督学习的替代方法,例如无监督学习[3],半监督学习[4],弱监督学习[5]和元学习[6]。最近,自我监督学习(SSL)它确实引起了计算机视觉的极大关注(见图1),并减少了人工监督 取得重大进展。事实上,通过从未标记数据中提取代表性特征,[7]。

同时,深度学习的成功也导致了遥感领域的显著进步[8]。在这方面,自我监督学习是遥感研究的一种有前途的方式。虽然在计算机视觉中存在SSL综述[9、10、11、12],但对遥感领域缺乏教学和最新介绍。本文旨在弥合这一差距,的。

本文对遥感领域进行了全面的自监督视觉表征学习介绍和文献综述。

本文总结了自我监督方法的分类,涵盖了计算机视觉和遥感领域的现有作品。

本文利用ImageNet已建立的数据集[2]SSL量化方法的性能基准,并将分析扩展到三个多光谱卫星图像数据集:BigEarthNet [13]、SZ incoms[14]和So2Sat-LCZ42 [15]

本文讨论了自然图像与遥感数据的联系,为遥感与地球观测的自监督学习的未来工作提供了见解。

在机器/深度学习方法的实际应用中,需要大量的训练数据。幸运的是,它越来越多地用于地球观测 开放获取 为遥感研究人员提供了大量这样的数据。然而,如此多的地球观测数据的注释意味着每天都需要频繁更新的重要人类互动。例如,单个大规模数据集可能需要单独的注释,除了大量需要标记的采样数据外。此外,由于自然和人为的变化,感知物理世界。这两个方面大大扩大了标记地球遥感数据的努力。

遥感领域机器学习的另一个挑战是。由于遥感图像的质量和各种具体应用的复杂性,在大规模数据标记中很难产生完美的标签。:大而嘈杂的标签数据集可能会偏离模型,而少量的高质量标签通常会导致过拟合。

此外,在没有足够标签的下游任务微调深度学习模型之前,在已建立的基准数据集上进行预训练已经成为一种流行的做法。这个过程通常被称为[16]监督预训练的性能。良好的预训练模型在类似的数据集中表现良好,但在不同的数据集中并不那么有用。

所有这些挑战都强调,,语料库需要能够使用未标记的数据来学习,很容易迁移到多个应用程序 有价值的信息技术。自我监督学习为解决这一困难提供了一个范式。

图2描述了自我监督学习的基本原理。,利用大量未标记的数据优化目标,从而训练模型f,不需要任何人工注释。通过精心设计的自我监督,模型f 获取捕获输入数据的高级能力。之后,模型f 实际应用可进一步迁移到监督下游任务。

设计这种自监督:(1), f(x)→x,(2),其(例如,预测旋转图像的旋转角度),f(x)→c,(3)(例如,同一图像的两个增强视图的编码特征应该是相同的),|f(x1)?f(x2)|→0。

在自监督训练成功的情况下,预训练模型f 可转移到下游任务。与监督预训练相比,

标签: td系列传感器kl2v传感器v3接近传感器zc01029950传感器

锐单商城拥有海量元器件数据手册IC替代型号,打造 电子元器件IC百科大全!

锐单商城 - 一站式电子元器件采购平台