MobileNetV2:倒置残差和线性瓶颈
摘要
本文描述了一种新的移动架构 MobileNetV2.它提高了移动模型在多个任务和基准测试以及不同模型大小范围内的最新性能。 我们还描述了在我们称为 SSDLite 这些移动模型在新框架中应用于对象检测的有效方法。 另外,我们演示了如何通过我们称之为它 Mobile DeepLabv3 的 DeepLabv3 构建移动语义分割模型的简化形式。
基于倒置残差结构,在薄瓶颈层之间快速连接。 中间扩展层采用轻量级深度卷积过滤特性作为非线性源。 此外,我们保持代表性,我们发现去除窄层中的非线性非常重要。 我们证明这可以提高性能,并提供导致这种设计的直觉。
最后,我们的方法允许将输入/输出域与转换的表达分离,为进一步分析提供了一个方便的框架。 我们在测量 ImageNet [1] 分类、COCO 对象检测 [2]、VOC 图像分割 [3] 上的性能。 我们评估权衡 精度与乘加 (MAdd) 测量的操作量与实际延迟与参数量的关系。
1、简介
神经网络彻底改变了机器智能的许多领域,为具有挑战性的图像识别任务提供了超人的准确性。 然而,提高准确性的动力往往是昂贵的:现代最先进的网络需要大量的计算资源,超出了许多移动和嵌入式应用程序的能力。
本文介绍了为移动和资源有限环境量身定制的新神经网络架构。 通过显著减少所需的操作和内存数量,同时保持相同的准确性,我们的网络推广了移动定制计算机视觉模型的最新技术。
我们的主要贡献是一个新的层模块:具有线性瓶颈的倒置残余。该模块将低维压缩表示为输入,首先将其扩展到高维,并使用轻量级深度卷积进行过滤。 然后将特征投影回具有线性卷积的低维表示。 官方实现在 [4] 中作为