本文的目标是检测胎盘的语义轮廓,即不分割整个胎盘,只标记边缘位置。
本文的方法是在简单多尺度特征融合的基础上增加两个新模块,一个关注全局信息,一个关注局部信息。
先来看看传统的多尺度特征融合方法
在这些方法中,多尺度的特征通常是简单的直接拼接或1*1卷积后拼接。即使是最复杂的DS-FPN,信息只分为两种方式,一路累积。
本文提出的模型结构如下
在这种方法中,无论是主路径上的图像,还是发送集成图像,都要么通过GC模块,要么通过CGE模块。
GC通过1,模块关注全局信息*1卷积结合各通道的信息,然后通过softmax判断每个像素的重要性。因为softmax之后,每个像素的大小排名保持不变,得分越高,模型越被认为是前景目标。将此特征图乘以到原始图像,可以增强模型在各通道上认为重要的区域,消除模型认为非前景区域。
然后将此特征图卷积加回原图像,以增强源图像的相关区域。
在CGE在中间,因为只关注局部信息,所以使用的方法是分组卷积。这里不再重复分组卷积。具体内容请参考本博客:group convolution (分组卷积)详解
简而言之,分组卷积就是把图像和卷积核分成几组,可以减轻显存负担,因为图像的一部分只能一次放进显存操作。