资讯详情

【CV】用于图像恢复的深度学习方法综述论文(2022年)

论文名称:A survey of deep learning approaches to image restoration 论文下载:https://www.sciencedirect.com/science/article/pii/S0925231222002089?via=ihub 论文年份:2022 (2022/04/27)

Abstract

In this paper, we present an extensive review on deep learning methods for image restoration tasks. Deep learning techniques, led by convolutional neural networks, have received a great deal of attention in almost all areas of image processing, especially in image classification. However, image restoration is a fundamental and challenging topic and plays significant roles in image processing, understanding and representation. It typically addresses image deblurring, denoising, dehazing and super-resolution. There are substantial differences in the approaches and mechanisms in deep learning methods for image restoration. Discriminative learning based methods are able to deal with issues of learning a restoration mapping function effectively, while optimisation models based methods can further enhance the performance with certain learning constraints. In this paper, we offer a comparative study of deep learning techniques in image denoising, deblurring, dehazing, and super-resolution, and summarise the principles involved in these tasks from various supervised deep network architectures, residual or skip connection and receptive field to unsupervised autoencoder mechanisms. Image quality criteria are also reviewed and their roles in image restoration are assessed. Based on our analysis, we further present an efficient network for deblurring and a couple of multi-objective training functions for super-resolution restoration tasks. The proposed methods are compared extensively with the state-of-the-art methods with both quantitative and qualitative analyses. Finally, we point out potential challenges and directions for future research.

研究意义

在本文中,我们广泛回顾了图像恢复任务的深度学习方法。几乎所有图像处理领域,特别是图像分类领域,都引起了广泛的关注。然而,图像恢复是一个基本而具有挑战性的主题,在图像处理、理解和表达中发挥着重要作用。

图像恢复的细分研究方向

图像恢复方法

深度学习图像恢复的方法和机制差异很大。

  • 能有效处理学习恢复映射函数的问题。

  • 在一定的学习约束下,性能可以进一步提高。

本文工作

本文对图像去噪、去模糊、去雾、超分辨率等深度学习技术进行了比较研究,

研究结果

广泛比较了最新的定量和定性分析方法。最后,我们指出了未来研究的潜在挑战和方向。

1. Introduction

自上个世纪以来,图像恢复一直是数字图像处理的长期研究课题[1-5],近年来仍然是一个活跃的课题。图像恢复。多维退化观察 (multidimensional degraded observations) 图像恢复之间的无限可能映射决定了这一点。对于已知且可逆的映射,相应的解很容易得到,但这种映射是唯一的,缺乏普遍性。。因此,

传统的图像恢复方法主要基于高等数学和概率模型来解决逆问题 假设退化图像 Y 一般公式是通过清洁图像 X 与模糊核 B 卷积,进一步增加噪音 N 的结果,如下所示, 在这里插入图片描述 先验可根据各种任务进行调整,如反卷积 超分辨率[9-11] [12-14]、修复 [15-17] [18-20]、医学 显微镜[21-23] [24-26] 等。人们对兴趣也越来越大。

在过去的十年里,。卷积神经网络(CNN)一是提高了分类检测性能[46],提出了许多网络架构来解决基准研究任务。

  • VGGNet [47] 指出深度网络架构是有益的,之前的研究主要集中在浅层网络上 [48]。
  • ,并成为以下方法的基本结构,如
    • EDSR [49](用于超分辨率)
    • DeepDeblur [50](用于模糊图像)
    • DnCNN [35](用于图像去噪)。
  • DenseNet [51] 进一步提高网络性能,开发与密集连接的卷积层残差链接。

例如,深度学习方法给图像恢复带来了许多好处,

  • 。基于深度学习的方法在大多数基准数据集中明显优于传统方法。
  • 。视频的退化可以通过考虑顺序帧或填充一些缺失的内容来恢复,而退化过程不能通过数学建模(如修复)来进行。
  • 使用图形处理单元 (GPU) 等待并行处理单元,

但仍有许多挑战:

  • 的角度来看,基于深度学习的方法具有相大的计算成本,使得它们难以部署在实时处理中。此外,矩阵处理对计算机硬件的要求更高,在GPU和内存方面,工业上常用的嵌入式系统,例如微控制器单元(MCU)无法满足。
  • 上看,现有算法还有很大的提升空间。
  • 的角度来看,深度学习 CNN 需要大数据集,不易获取、不易标注,可能与实际情况不匹配。例如,许多去模糊或超分辨率应用更关注人脸,但大多数现有的训练数据集包含的人脸样本相对较少,而汽车或建筑物等许多其他样本可能对特定应用没有帮助。

还有一些,例如 [52] 和 [53]。图像恢复中的想法和新方法可以使上述任务受益,反之亦然。

本调查旨在及时更新和概述图像恢复的深度学习方法,组织如下。

  • 第 2 节总体上回顾了现有的用于图像恢复的深度神经网络,然后详细回顾了用于去模糊、去噪和超分辨率任务的模型。还审查和讨论了各种图像质量评估标准。
  • 第 3 节回顾和分析了典型的网络架构和学习策略。简要考虑了最新的模型。然后,我们提出了一些用于去模糊和超分辨率任务的网络,以及与最先进模型的广泛实验和比较。
  • 最后一节讨论了这些网络、性能和结果,以及剩余的挑战并总结了工作。还提出了未来的工作和研究方向。

2. Deep Networks for Image Restoration

2.1. Image Restoration

有几种方法可以在数字图像恢复中应用深度学习。。与复杂的手工图像先验和为推导此类先验所做的大量工作相比,,以(例如 ADMM(乘法器的交替方向方法)[57] 和 [58]),并有助于实现比那些基于分析模型的先验。此外,深度学习方法采用 [59,60,56,61] 和 [62,63],以便。已经进行了大量的研究以将流行的深度学习技术应用于解决图像恢复任务。

最近,,并超越了一般的基于 CNN 的方法,提升了最先进的性能 [64-66]。 [67-69]。此外,这些先进的网络在各种应用中取得了重大进展,包括

2.2. Image Deblurring

在实践中是常见的,并且由于各种因素,如长曝光时间内不可避免的运动、成像设备的物理限制和不完善的系统、未知的退化过程等,这些。研究人员付出了许多努力,并致力于开发有效和新颖的方法来解决这些挑战性的问题。

在现实生活的图像捕捉中普遍存在。模糊可能是由相机运动、物体运动和场景深度变化的混合造成的。相机运动有两类六个自由度,平移和旋转运动。平移运动与深度变化有关 [73,74],而旋转相机运动和物体运动是独立的因素,也会导致。许多尝试有助于

有研究回顾了代表性的作品并比较了单个图像去模糊的性能。Wang等人[75]对图像去模糊的传统方法进行了回顾,定义了常见成像中出现的模糊,并根据各自的特征将方法分为五个主要框架。由于基于学习的方法当时还没有得到很好的发展,神经网络只是被认为是一个有希望进一步研究的课题。Lai等人[76]使用他们自己的真实世界模糊图像和人类受试者研究(Amazon Turk)评估和比较了13种单一图像去模糊算法。最近的NTIRE(图像恢复和增强的新趋势)2020图像和视频去模糊挑战介绍了最先进的方法,并提供了公平的排名和性能比较[77]。Koh等人[78]提供的最新调查回顾了自2013年以来基于深度学习的非盲和盲去模糊技术的发展。在该论文中,一项比较研究阐明了知觉损失引起的伪影、显式图像先验的优越性和无监督学习的潜力。

有研究回顾了代表性作品并

  • Wang et al. [75] 对传统的图像去模糊方法进行了回顾,定义了常见成像中发生的模糊,并根据各自的特征将方法分类为。由于当时基于学习的方法还没有得到很好的发展,神经网络只是被认为是一个有前途的进一步研究的课题。
  • Lai et al. [76] 通过使用他们自己的真实世界模糊图像和人类主题研究 (Amazon Turk) 评估和比较了 13 种单图像去模糊算法。
  • 最近的 NTIRE(图像恢复和增强的新趋势)2020 年图像和视频去模糊挑战介绍了最先进的方法,并提供了公平的排名和性能比较 [77]。
  • Koh et al. [78] 提供的最新调查。回顾了自 2013 年以来基于深度学习的非盲和盲去模糊技术的发展。在论文中,一项比较研究说明了

  • 它最早是在[50]中提出的,它应用了 Eigen et al. [79] 开发的多尺度结构。
  • Tao et al. [80] and Gao et al. [81] 开发了多尺度去模糊网络,Zhang et al. [82] 在采用时对结构和机制进行了根本性的后续更改,与其他三种方法相比存在显着差异。

  • 该方法使用残差网络块 [39] 作为生成器的主要组件。

  • DeblurGAN-v2[64] 是 DeblurGAN 的更新版本,使用最初提出用于对象检测 [83,84] 的

  • [85] 的作者提出了一个。以前,有监督的深度学习网络广泛依赖于大量的配对数据,这对获取要求很高且具有挑战性,而无监督的训练方案可以实现与非配对数据相当的性能。

  • [86] 提出了另一种,用于特定领域的单图像去模糊。

[87] 的作者提出了一种称为 Dr-Net 的新型网络。他们。 [88] 报告说,,并提出了一种,该架构可以隐式地发现导致输入图像中不均匀模糊的空间变化移位,并学习调制滤波器

表1、表2和表3给出了各种不同方法的比较。

2.3. Image Denoising

图像去噪是图像恢复中的另一项重要任务,从多方面对低层次视觉具有非凡的价值。首先,在各种计算机视觉任务中。其次,[94]。传统上,。基于学习的去噪不仅关注深度学习,还关注其他机器学习方法。这种差异是由于噪声机制广泛适用于许多信号处理方法。。有关基于学习的图像去噪的概述,请参见 [109]。在数学上,噪声图像 Y 可以表示为 其中 X 表示真实图像,N 表示被 X 破坏的加性噪声。噪声本质上也可以是乘法的。深度 CNN 于 2015 年开始应用于图像去噪[110,111]。第一个重要的工作是 [112],它首先应用了一个非常深的带有跳跃连接的 CNN。 [93] 开发了一种具有核喷射 (kernel-splatting) 架构的蒙特卡罗去噪方法。

根据噪声的类型,

  • 加性白噪声图像(additive white noise image, AWNI)去噪
  • 真实噪声图像去噪
  • 盲去噪
  • 混合图像去噪

在这些类别中,AWNI 最受关注。然而,。因此,

可以在最近的概述 [109] 中找到相关的。在本小节中,我们的目标是比较基于学习的去噪方法以及其他图像恢复任务。。例如,DnCNN [35]首先提出了图像恢复中的残差学习。这里的残差学习学习不同于 ResNet [39]。。一般来说,。残差学习方法对图像恢复有很大的影响,。综合图像去噪方法的比较见表 4。

2.4. Image Dehazing

大气散射模型是模糊图像生成的经典描述: 其中 Y 是观察到的有雾图像,X 是要恢复的无雾场景辐射度。有两个关键参数:A 表示全局大气光,t 是透射矩阵,定义为: 其中b是大气的散射系数,d是物体与相机之间的距离。

由于雾、尘等混浊介质的存在,。许多计算机视觉算法只能在没有雾霾的场景辐射度上运行良好。

  • [113]重新构建了一个图像形成模型,该模型除了传输函数之外还考虑了表面阴影。
  • [115] 是一种基于早期学习的方法。
  • [116] 提出了一种基于重新制定的大气散射模型,通过轻量级 CNN 直接生成干净图像的一体化方法。
  • [117] 通过使用鉴别器引导生成器在粗略的尺度上创建伪逼真图像,引入了用于去雾的GAN,而生成器之后的增强器则需要在精细尺度上产生逼真的去雾图像。
  • RYF-Net [120] 使用传输图融合网络来整合两个传输图,并为雾霾图像估计鲁棒准确的场景传输图。
  • DCP-Loss [122] 使用暗通道先验作为损失函数。
  • [123] 的作者提出了一种基于异构 GAN 的方法,该方法由用于生成清晰图像的 CycleGAN 和用于保留纹理细节的条件 GAN 组成。
  • Cycle-dehaze [124] 中可以看到类似的工作。
  • FAMED-Net [125] 包括三个尺度的编码器和一个融合模块,以有效和直接地学习无雾图像。
  • [126]提出了一种域适应范式,由一个图像翻译模块和两个图像去雾模块组成。
  • [127] 的作者采用了一种新颖的,通过
  • 与许多图像去模糊网络类似,DCPDN [128] 采用密集连接结构。

表 5 给出了。见图 1。

2.5. Image Super-resolution

。由于其在广泛的应用中的实用价值而引起了广泛的关注。在超分辨率发展的早期阶段,多个低分辨率(LR)图像的可用性被认为是基本前提,恢复和插值技术是先决条件,它们共同有助于获得高分辨率(HR)图像。当只有一张 LR 图像可用时,该问题变得更具挑战性,被称为。与其他恢复任务不同,。在方程 1 的基础上,退化 (degradation) 在模糊后应用下采样算子 D,如公式 7 所示。观测模型如图 2 所示。

2.6. Image Quality Assessments

。只有提供统一的质量度量,才能进行公平的比较,以令人信服和可靠的证据反映算法和系统的特征和属性。最初,图像质量测量 (IQM) 主要用于评估图像压缩和采集技术,然后推广到其他图像处理任务和图像通信网络 [153]。由于图像的最终接收者是人类,因此对图像视觉质量最可靠的评估是通过收集大量测试示例的评分的主观人类研究。但是,进行此类研究以在实践中为每个案例提供质量评估是耗时且通常过于昂贵的。因此,非常需要一种旨在有效预测感知质量同时与人类视觉系统 (HVS) 响应相关的客观 IQA。

客观质量测量最常见的分类是,即

  • :计算失真图像和参考图像之间的相似性。
  • :当参考图像的部分信息可用时应用 RR 测量。
  • :NR 测量利用图像统计来评估图像质量,因为参考图像的信息完全不可用。

最简单的客观 FR 测量是,基于参考图像和退化图像之间的均方误差 (MSE)。

  • 尽管被广泛采用,但众所周知,像 PSNR 这样的图像保真度测量无法很好地与视觉质量相关联[154,155]。

  • [156] 介绍了结构相似性指数测量(Structural similarity index measure, SSIM)。进一步近似 HVS 的质量评估,利用其在结构信息变化中的敏感性。 SSIM 有一些变体,如多尺度 SSIM [157]、三分量 SSIM [158] 和四分量 SSIM [159],进一步发展以进行泛化。

  • 此外,还可以引入信息论来推导图像质量评估,例如 [160] 提出的信息保真度标准 (IFC)。

  • 随后是视觉信息保真度测量 (VIF) [161] 的扩展工作。

  • 此外,诸如特征相似性指数测量 (FSIM) [162]、DCTune [163]、基于小波的失真测量 [164]、基于 Haar 小波的感知相似性指数 (HaarPSI) [165] 等测量,利用来自其他域的图像特征来近似响应的 HVS。

  • 许多研究对 FR IQA [166–168, 160,169–171] 提供了有价值的评论。

  • RR IQA 措施适用于存在参考图像或退化过程的部分信息时,并且可以被视为中间情况,灵感来自 FR 和 NR IQA 措施 [172-175]。

表 6 中给出了具有方程的代表性 FR 和 RR 方法。 当原始参考图像无法用于质量评估时,NR IQA 措施很有用。大多数 NR IQA 措施采用的一个共同特征是(natural scene statistics, NSS)[177,178],它对各种退化和图像内容具有不变的属性,这些措施包括:

  • 盲/无参考图像空间质量评估器(BRISQUE)[179]

  • 基于失真识别的图像真实性和完整性评估器(DIIVINE)[180]

  • 自然图像质量评估器(NIQE)[181]。

图 3 提供了代表性 NR 方法的流程:BRISQUE、BLIINDS-II [182]、DIIVINE 和 NIQE。 NR IQA 还采用了其他功能,例如 DCT 域中的 NSS [183,182],多元高斯模型中的 NSS [184],梯度幅度[185,186]等。[187]中提出的感知指数(PI)结合了两种NR方法([181,188]),用于对生成的图像进行感知评估。 在 IQA 测量的开发过程中,许多研究报告了基于失真的测量和感知质量测量之间的冲突。因此,在 [189] 中系统地说明了感知和失真之间的权衡。已经进行了相关研究来分析这种权衡[190,191],并且讨论得出的结论是,

最近,深度学习被开发为 IQA 的替代范式,该范式。端到端训练使深度神经网络能够实现比以前的手工方法。但考虑到采集ground truth MOS/DMOS值的难度,。模型和微调对于推广基于深度学习的方法来说也是一项重要且关键的任务。

3. Network Architectures and Learning Strategies

3.1. Baseline Models

多层感知器 (MLP) [201] 是最早用于图像恢复的人工神经网络之一 [202-206]。恢复需要相同维度的输入和输出图像,,并且。然而,由于大量参数的冗余给计算资源和存储带来负担,。此外,,这是进一步发展的另一个障碍。

考虑到图像的结构特性和 MLP 的不足,采用卷积神经网络(图 4b)(例如 [207])并为图像恢复提供更合适的解决方案。。尽管观察到增加网络深度通过大感受野和有意义的层次特征有利于 CNN 的模型性能,但成为棘手的问题。因此许多先进的技术来处理这些问题。发明了。残差块(图 4c)可有效提高性能,并成为。其他网络范例包括无监督学习方案下的编码器-解码器、自动编码器和变分自动编码器,旨在。生成对抗网络 ,在生成的图像中产生似是而非的纹理。由于基于 GAN 的模型中所需的配对训练图像难以获得,因此提出了非配对训练,例如cycleGAN [209],将循环一致性损失设计为一种生成高质量图像的正则化技术(图 4h)。为了防止模式崩溃问题,[210](

3.2. Learning Strategies

3.2.1. Supervised, semi-supervised and unsupervised learning

只要有标记的数据可用,采用监督学习来训练神经网络是常见且直接的。通过网络层最小化成本函数和反向传播可在有效监督下实现强大的学习能力。它鼓励网络向目标分布收敛并产生所需的输出。典型的应用是分类和回归,目的是预测或推理。然而,对于训练深度神经网络,由于。为了缓解这些问题,早期停止 [212]、dropout [213] 和权重共享 [214] 等技术用于规范模型复杂性,这些技术在当今设计和训练深度神经网络中变得必要。此外,收集匹配的图像对以训练图像恢复中的深度网络非常耗时。

。因此,。原始输入和重建输出之间的重建损失对于无监督学习利用深度网络的表示能力很重要。。在实践中,标记或配对训练数据的数量总是稀缺的。为了利用大量未标记数据和少量标记数据,半监督学习[223]利用了监督和非监督学习的内在优势。在监督下,深度网络能够从训练数据中生成所需的输出,但性能也受到限制。未标记的数据便宜且易于获取,无监督和半监督学习使用它们来提高网络在准确性和泛化能力方面的性能。并且表明,在预先指定的假设下,对于某些类别的问题,无监督学习能够胜过监督学习[224-230]。 。 [231] 中的作者使用半监督学习来训练深度 CNN 以去除单幅图像雨水,并取得了比最先进的方法更优越的性能。

3.2.2. Autoencoder and adversarial networks

自动编码器:。自动编码器的。与降维一起,。自动编码器存在许多变体,旨在强制学习的表示假设有用的属性。例如,正则化自动编码器(稀疏、去噪和收缩),它们在学习后续分类任务的表示方面是有效的。 Autoencoders 和 aariational auto-encoders 可以用作生成模型的一个组成部分。自编码器广泛用于图像去噪[232,233]和超分辨率[234-236]。像 [237] 这样的去模糊网络也与自动编码器有关。具体来说,作者使用 GAN 生成模糊图像作为给定输入清晰图像的表示,并将自动编码器的重建部分用作去模糊网络。

对抗网络:Goodfellow 等人 [208] 介绍的生成对抗网络,是定义两个竞争网络之间的博弈:鉴别器和生成器。生成器从输入接收信息并生成样本。鉴别器从真实样本和生成样本中学习,并尝试区分它们。生成器的目标是通过生成无法与真实样本区分开的感知上令人信服的样本来欺骗鉴别器。生成器 G 和判别器 D 之间的博弈具有以下极小极大目标: 其中 。 GAN 以其在视觉任务中生成具有良好感知质量的样本的能力而闻名。然而,GAN 的 vanilla 版本的训练通常会遇到许多问题,例如,如 [67] 中所述。。[238] 讨论了由 JS-散度 近似引起的GAN训练困难,并提出: 其中 D 是 1-Lipschitz 函数的集合,Pg 是模型分布。

这里的想法是批评价值接近 K × W ( P r , P θ ) K \times W(P_r,P_{\theta}) K×W(Pr​,Pθ​),其中 K 是 Lipschitz 常数,W Pr; W ( P r , P θ ) W(P_r,P_{\theta}) W(Pr​,Pθ​) 是 Wasserstein 距离。在这种情况下,鉴别器网络称为 critic,它近似于样本之间的距离。: 这种方法对于生成器架构的选择是稳健的,并且几乎不需要超参数调整。这对于图像去模糊至关重要,因为它允许使用轻量级架构,而不是之前用于图像去模糊 [50] 的标准 Deep ResNet 架构 [39]。基于 GAN 的方法在去噪 [241-245] 和超分辨率 [36,246-250] 中也很流行。

3.3. State-of-the-Art models

基于学习的单幅图像恢复仍然是一个活跃的话题。除了运动去模糊,散焦去模糊 (defocus deblur) 引起了越来越多的关注。例如,[251] 利用了大多数现代相机上的双像素(DP)传感器上可用的数据,[252] 提出通过将经典的 Wiener 反卷积框架与学习的深度特征相结合,在特征空间中执行显式反卷积过程。

。对于图像超分辨率,研究人员开始关注不同的场景。例如,使用内部数据可以像使用单个图像一样训练超分辨率网络,这称为零样本 (zero-short) 超分辨率(ZSSR)[253],MZSR [254] 通过添加元-训练阶段,加快训练速度。图神经网络也开始在超分辨率方面让路[255]。。 Nose2Siame 既不需要 J 不变性(这可能导致更差的去噪模型),也不需要关于噪声模型的额外信息,因此可以用于更广泛的应用。

4. Proposed Networks

4.1. Super-resolution

由于训练目标函数中涉及多个损失分量,因此需要同时最小化各种损失。线性组合是最直接的手段,。我们假设多个损失分量自然形成的多维损失空间是欧式的,每个单独的损失代表空间中相互独立的一个维度。。因此,复杂的多目标优化问题转化为单目标优化。表 7 描述了数学公式。 [257] 中提出的 Ed 和 Hypervol 公式的共同特征是在训练过程中学习的梯度加权,以及对每个单独损失的自动重要性分配。与大多数现有方法采用的手动微调加权参数相比,所提出的训练目标函数的 Ed 公式提供了一种优化给定模型结构的模型性能的替代方案。

这两种方法的梯度加权因子不同。基于欧几里得距离的方案利用个体损失在原点和损失位置之间的欧几里得距离上的投影。而 Hypervol 公式的梯度加权因子计算损失和相应损失界限之间距离的倒数。从表 7 可以看出,Ed 公式的方程更加简洁,没有额外的超参数需要预定义,而 Hypervol 公式需要在实现之前确定损失边界 lk。

我们在基线模型 SRGAN [36] 上应用了提出的方法,并采用了与 SRGAN 论文中相同的实现细节。在原论文[36]给出的对抗性损失Ladv和感知损失LX的基础上,我们还加入了 MSE 损失LMSE 和 SSIM 损失 LSSIM 作为附加约束,形成多维损失空间。损失函数如下, 其中 ILR 表示输入低分辨率图像,IHR 表示高分辨率图像, ϕ i ; j \phi_{i;j} ϕi;j​ 是VGG19网络中第 i 个最大池化层之前第 j 个卷积激活后得到的特征图。Wi;j 和 Hi;j 是特征图的维度。

对于训练目标函数的原始公式,在[36]中给出的方程的基础上,L = 10^-3 Ladv + LX,加入加权为 10^-2 的 MSE 损失 LMSE 或 SSIM 损失 LSSIM,构成多目标训练函数, 我们在四个 SR 数据集 Set5 [258]、BSDS100 [259]、DIV2K 验证集 [260] 和 RealSR [261] 上测试了我们的方法。定量结果在表 8 中给出。对于视觉比较,示例测试图像和补丁如图 6 所示。我们使用了四种质量评估措施:基于失真的 PSNR、SSIM 和基于感知的 VIF、PI。对于 PSNR、SSIM 和 VIF 指标,。 PSNR、SSIM 和 VIF 指标的描述和计算见表 6,PI 使用 Ma 的分数 [188] 和 NIQE [181] 计算如下, 从表 8 中,我们可以发现。与使用固定损失权重定义的原始公式相比,所提出的方法和 Hypervol 公式。此外,研究表明,将其他损失作为正则化的额外约束是有益且必要的。其中,。正如对使用不同训练目标函数训练的模型生成的图像的质量评估所反映的那样,使用训练目标函数 f ( L a d v , L X , L S S I M ) f(L_{adv}, L_X, L_{SSIM}) f(Ladv​,LX​,LSSIM​) 的模型;通常产生的图像比使用训练目标函数 f ( L a d v , L X , L M S E ) f(L_{adv}, L_X, L_{MSE}) f(Ladv​,LX​,LMSE​) 的图像得分更高。来自训练目标函数 f ( L a d v , L X , L M S E , L S S I M ) f(L_{adv}, L_X, L_{MSE}, L_{SSIM}) f(Ladv​,LX​,LMSE​,LSSIM​) 的实验,我们可以发现,。 对于视觉评估,(放大时可以找到更精细的细节),因为整体视觉差异太微不足道而无法区分。我们可以观察到 Ed 公式引入了模糊伪影,而 Hypervol 公式能够恢复更精细的细节。此外,

4.2. Deblurring

在本文中,我们还提出了一个。我们采用密集连接的编码器-解码器结构来追求强大的去模糊性能。我们删除了 [81] 中使用的所有参数共享。。此外,我们移除了多尺度结构以进一步简化网络。 。网络的。默认情况下,每个非线性 DenseBlock 模块有四个处理单元。使用的 ResBlock 的结构如图 7 所示,包括两个卷积层。对于框架,我们去除了多尺度结构和参数共享机制,从而简化了网络。编码器-解码器结构基于 12 个具有独立参数的 DenseBlock。我们。 Inception-A 是 Inception-v4 的组件之一,具有适合图像恢复的输入大小和特征图宽度,包含 382 个通道。。通过采用 inception-A,所提出的网络具有来自 DenseNet 和 Inception-A 网络的混合特征提取机制,因此被称为MixNet。

。根据第 2 节的回顾,MSE 损失被称为图像去模糊最重要的损失。它与 PSNR 直接相关,,如下所示: 因此,在这项工作中,我们采用 MSE 损失作为损失函数。根据我们的经验,添加其他辅助损失(例如 SSIM 损失或对抗性损失)可能并不总是对去模糊产生显著影响。

结果和比较:我们对提出的 MixNet 进行了实验,并与 GoPro 数据集上动态场景去模糊和非均匀去模糊的最新方法进行了比较。比较的方法包括 DeepDeblur [50]、Scale Recurrent Network (SRN-Deblur) [80]、DSHMN [82]、DeblurGAN [33]、DeblurGANv2 [64]、无监督去模糊 [85]、域空间 [86]、SVRNN [ 89]、Dual Residual [90]、Douglas-Rachford 网络 [87]、区域自适应 [88] 和 Blur2Flow [262]。结果由在默认 GoPro 训练数据集上训练的模型生成,然后在 GoPro 测试数据集上进行测试。对于无监督学习方法、无监督去模糊和特定领域,我们使用了训练数据集中的模糊图像,以及分辨率更高的新 GoPro 数据集中的清晰图像。对于基于核的方法,包括 Blur2Flow 和基于优化的方法,我们在其发布的模型代码上对其进行了测试。定量结果和评价见表 9。 一般来说,无监督学习方法会导致低 PSNR 和 SSIM,正如预期的那样,由于不涉及监督(基本事实)并且无监督学习的数据集大小有限。此外,这些网络主要是为了探索这种训练机制而开发的,而网络结构在很大程度上是不发达的。尽管 Dr-Net 的 SSIM 性能最好,所提出的 MixNet 在所有其他评估标准上都达到了最先进的性能。此外,我们的 MixNet 在运行时间和性能方面取得了很好的平衡,而 Dr-Net 的运行时间是 MixNet 的两倍。 GoPro 评估数据集的视觉比较如图 8 所示。如图所示,所提出的模型通常比其他方法产生更好的结果。域特定网络是无监督去模糊的代表,显然它在颜色上有一定的失真。 我们还在 HIDE 数据集上评估和比较了我们的方法,定量结果如表 10 所示。这些结果是由在默认 HIDE 训练数据集上训练的模型生成的。如图所示,所提出的 MixNet 在所有这些评估标准中都优于或匹配这些最先进的方法。

4.3. Contributions

在这里,我们总结了本文的主要贡献。

  • Comprehensive review

    对图像恢复、图像去模糊、图像去噪、图像去雾、超分辨率和图像质量评估进行了全面的文献综述。还审查了所有相应的基线深度模型。

  • 超分辨率和去模糊的新方法

    提出了用于超分辨率的 GAN 训练目标函数的新公式,作为 Hypervol 公式的扩展 [257]。提出了一种新的平衡图像去模糊方法——MixNet。

  • 实验验证

    进行了广泛的实验,将 Ed 和 Hypervol 公式应用于 SRGAN 的各种训练目标函数以实现超分辨率,并获得了改进。进行了实验以将提出的 MixNet 与最先进的去模糊方法进行比较,结果表明,与主流图像去模糊网络相比,MixNet 具有更好的性能。

5. Conclusions and Discussion

。在实践中,退化机制和噪声模型很少是简单和统一的。因此,

标签: 3050al旋转传感器连接器q18j4a加速度传感器必不可少1207g传感器保真mos环振式数字加速度传感器

锐单商城拥有海量元器件数据手册IC替代型号,打造 电子元器件IC百科大全!

锐单商城 - 一站式电子元器件采购平台