超分辨率重建基础知识总结
-
- 为什么使用超分辨率重建?
- 2.经典图像插值算法有哪些限制?
- 3.超分辨率重建的方法有哪些?
- 4.超分辨率重建技术与图像恢复技术的区别与联系?
- 5、SR常用的评价指标
- 基于重建的方法
- 基于学习的图像超分辨率
- 基于深度学习的图像超分辨率重建技术
超分辨率是计算机视觉的经典应用。SR是指在监控设备、卫星图像遥感、数字高清、显微成像、视频编码通信、视频恢复、医学影像等领域,通过软件或硬件的方法重建相应的高分辨率图像(说白了就是提高分辨率)。 本博文主要介绍SISR。SISR这是一个逆问题。对于低分辨率图像,可能有许多不同的高分辨率图像对应,因此在解决高分辨率图像时通常会添加先验信息进行标准化约束。在传统的方法中,这种先验信息可以通过几个成对的低分辨率图像实例来学习。以深度学习为基础SR从分辨率图像到高分辨率图像的端到端映射函数通过神经网络直接学习。
为什么使用超分辨率重建?
通常,图像传感器可以获得更好的质量,但在特殊情况下,由于许多因素,图像质量下降。例如,在图像采集和获取过程中: 成像、转换、编码、压缩、存储都会影响图像的分辨率。另外**,还有成像噪声、电气噪声和系统噪声的叠加**。所以实际应用中,无法按照理想状况实现,存在的这些因素,必然影响图像的质量,获得较高质量的图像分辨率也是相当困难的。理论上,只要增加成像系统的数量,最直接的方法是通过传感器制造技术减少像素尺寸,增加单位面积的成像点阵。 综上所述,由于技术水平和经济条件的限制,成像传感器和光学器件的性能指标可能无法满足应用的需要,因此,。
2.经典图像插值算法有哪些限制?
经典算法也可以提高图像分辨率,包括,但只能增加图像的像素大小,改变图像的视觉效果,不能突破原始信息量。因此,有必要有一种新的方法来克服信息不足的问题。 (1)最近的邻插值:也叫零阶插值(Nearest Neighbor Interpolation),插值最简单的方法。它是用原始图像中特定像素点的像素值填充收缩图像,容易实现。对于灰度图像,原始图像将逐点处理,每个像素点的灰度值将被插入倍数复制。插值函数是常量函数,是矩形函数。 最近,邻插值的优点是计算量很小,这使得该方法在许多场合得到应用。其缺点是插值后图像质量不高,经常出现方块效应和锯齿效应。 (2)线性插值,又称双线性插值(Bilinear Interpolation),它也是一种简单的插值方法,广泛应用于图像重建领域,主要是由于线性插值计算量低,图像质量优于邻域插值,因为它是二阶代数拟合。它被称为双线插值,因为它是通过线性插值处理获得的,分别对行和列像素。 线性插值放大产生的图像比最近邻域插值产生的图像更光滑,会出现灰度值不连续的情况。由于线性插值具有低通滤波器的性质,高频分量受损。当放大倍数增加时,放大图像也会出现明显的块状现象,在一定程度上模糊图像轮廓。 (3)三次插值(Cubic Interpolation),又称双三卷积值,是在线插值的基础上改进的。基本思想是增加邻域像素点,获得更好的插值函数。卷积过程如下:
优点是图像差值质量好。 (4)样条插值 上述三种插值属于传统的多项式插值,为了处理更多数据点,更好的逼近,必须增加了多项式阶数,则应用上受到很多限制。多项插值问题:一是多项插值受数据点位置影响较大。杠杆点的影响更大。第一多项插值受输入点变化影响较大。多项插值不局部,其形式由所有数据点决定。一点变化,整个多项式都要变化。 多项式插值在数据点间冲击称为龙格现象,可通过样条插值进行冲击(Spline Interpolation)解决问题。样条是多项式分段定义的特殊函数。样条插值比多项式插值更容易使用,低级样条插值可达到高级多项式插值效果,避免龙格现象,样条插值具有保凸特性。样条插值在插值点一阶连续可导,与预期函数的均方误差最小。
3.超分辨率重建的方法有哪些?
超分分为以下两种: Image SR。仅参考当前低分辨率图像,不依赖其他相关图像的超分辨率技术,称为单幅图像的超分辨率(single image super resolution,SISR)。 Video SR。参考多幅图像或多幅视频帧的超分辨率技术,称为多帧视频/多幅图像的超分辨率(multi-frame super resolution)。对于video SR,其核心思想是用时间带宽换取空间分辨率。简单地说,当无法获得超高分辨率图像时,可以取相邻帧,然后将这一系列低分辨率图像形成高分辨率图像。 一般来讲Video SR相比于Image SR它具有更多的参考信息和更好的高分辨率视频图像重建质量,但其更高的计算复杂性也限制了其应用。 它通常包括两个步骤:首先,图像匹配,即估计低分辨率图像之间亚像素级别的相对位移;其次,图像集成将多个低分辨率图像集成到高分辨率图像中。
4.超分辨率重建技术与图像恢复技术的区别与联系?
在超分辨率重建过程中,由于低分辨率图像序列往往受到光学模糊、运动模糊、噪声和混合因素的影响,超分辨率重建技术涵盖了图像恢复技术。两者的区别在于,图像恢复技术是在不改变图像大小的情况下恢复图像,因此图像恢复技术与图像超分辨率重建密切相关。可以认为,图像超分辨率重建是理论上的第二代图像恢复问题。一方面,研究图像超分辨率重建技术具有重要的理论意义,促进图像恢复技术的进一步发展;另一方面,克服光学成像系统硬件的局限性具有重要的实际意义。在某些情况下,原始的低分辨率成像系统可以继续使用,以获得满足特定分辨率要求的图像。
5、SR常用的评价指标
有两种,一种是PSNR(峰值信噪比)SSIM(结构相似性评价)SR压缩重构图像质量的基本测量指标。
(1)PSNR——峰值信噪比 Peak Signal-to-Noise Ratio PSNR测量压缩重构图像的质量是信号的最大功率与信号噪声功率之比,通常是分贝(dB)来表示。PSNR图像质量越图像质量越好。 P S N R = 10 ? log 10 ( M A X I 2 M S E ) = 20 ? log 10 ( M A X I M S E ) PSNR=10*\log_{10}(\frac{MAX_I^2}{MSE})=20*\log_{10}(\frac{MAX_I}{\sqrt {MSE}}) PSNR=10?log10(MSEMAXI2)=20∗log10(MSE MAXI) 其中,MAXI 表示的是图像中像素值中的最大值,MSE 表示的两个图像之间对应像素之间差值的平方的均值,单通道图像的MSE可以表示为如下公式:
M S E = 1 M ∗ N ∑ i = 1 N ∑ j = 1 M ( f i j − f i j ′ ) 2 MSE=\frac{1}{M*N} \sum_{i=1}^N \sum_{j=1}^M (f_{ij}-f'_{ij})^2 MSE=M∗N1i=1∑Nj=1∑M(fij−fij′)2
多通道(C通道)图像的MSE可以表示为如下公式:
M S E = 1 C ∗ M ∗ N ∑ k = 1 C ∑ i = 1 N ∑ j = 1 M ( f i j k − f i j k ′ ) 2 MSE=\frac{1}{C*M*N} \sum_{k=1}^C \sum_{i=1}^N \sum_{j=1}^M (f_{ijk}-f'_{ijk})^2 MSE=C∗M∗N1k=1∑Ci=1∑Nj=1∑M(fijk−fijk′)2
(2)SSIM——结构相似性评价 Structural Similarity Index SSIM是衡量两幅图像相似度的指标,其取值范围为[0,1],SSIM的值越大,表示图像失真程度越小,说明图像质量越好。 话不多说,先把SSIM的公式放上: L ( X , Y ) = 2 μ X μ Y + C 1 μ X 2 + μ Y 2 + C 1 L(X,Y)=\frac{2\mu_X\mu_Y+C_1}{\mu_X^2+\mu_Y^2+C_1} L(X,Y)=μX2+μY2+C12μXμY+C1
C ( X , Y ) = 2 σ X σ Y + C 2 σ X 2 + σ Y 2 + C 2 C(X,Y)=\frac{2\sigma_X\sigma_Y+C_2}{\sigma_X^2+\sigma_Y^2+C_2} C(X,Y)=σX2+σY2+C22σXσY+C2
S ( X , Y ) = σ X Y + C 3 σ X σ Y + C 3 S(X,Y)=\frac{\sigma_{XY}+C_3}{\sigma_X\sigma_Y+C_3} S(X,Y)=σXσY+C3σXY+C3
S S I M ( X , Y ) = L ( X , Y ) ∗ C ( X , Y ) ∗ S ( X , Y ) SSIM(X,Y)=L(X,Y)*C(X,Y)*S(X,Y) SSIM(X,Y)=L(X,Y)∗C(X,Y)∗S(X,Y)
其中,μX 和μY 为图像X,图像Y的像素的均值,σX 和σY 为图像X,图像Y的像素的标准值,σ XY代表图像X和图像Y的协方差。 此外,C1 ,C2和C3是常数,C1=(K1 * L)2,C2=(K2 * L)2,C3=1/2C3 ,一般的,K1=0.01,K2 = 0.03 ,L = 255 。
在实际操作中,对于求得图像像素的均值、方差和标准差,可以用高斯函数计算图像参数,可以保证更高的效率。同时,我们可以用平均结构相似性评价指标MSSIM来代替结构相似性评价指标SSIM。 平均结构相似性评价指标MSSIM:利用滑动窗将图像分块,令分块总数为N,采用高斯加权计算每一窗口的均值、方差和协方差,计算对应块的结构相似度SSIM,取平均值。 M S S I M ( X , Y ) = 1 N ∑ k = 1 N S S I M ( X k , Y k ) MSSIM(X,Y)=\frac{1}{N} \sum_{k=1}^{N} SSIM(X_k,Y_k) MSSIM(X,Y)=N1k=1∑NSSIM(Xk,Yk)
我们对于图像重构质量的评价指标还有其他许多种,但是我们也要思考的是真的是评价指标的高低和我们人眼看到的优劣是一致的么?除了这些常用评价指标外还有没有其他的指标可以衡量图像重构的质量。
基于重建的方法
通常都是基于多帧图像的,需要结合先验知识。有如下方法:
- 凸集投影法(POCS)
- 贝叶斯分析方法
- 迭代反投影法(IBP)
- 最大后验概率方法
- 正规化法
- 混合方法
基于学习的图像超分辨率
- Example-based方法
- 邻域嵌入方法
- 支持向量回归方法
- 虚幻脸
- 稀疏表示法
基于深度学习的图像超分辨率重建技术
基于深度学习的图像超分辨率重建的研究流程如下:
- 1,首先找到一组原始图像Image1;
- 2,然后将这组图片降低分辨率为一组图像Image2;
- 3,通过各种神经网络结构,将Image2超分辨率重建为Image3(Image3和Image1分辨率一样)
- 4,通过PSNR等方法比较Image1与Image3,验证超分辨率重建的效果,根据效果调节神经网络中的节点模型和参数
- 5,反复执行,直到第四步比较的结果满意