用于3D重构的深层隐式移动最小二乘函数（CVPR 2021）-锐单电子商城

点击上方“3D视觉车间，选择星标

第一时间送达干货

作者丨paopaoslam

来源丨泡泡机器人SLAM

标题：Deep Implicit Moving Least-Squares Functions for 3D Reconstruction

作者：Shi-Lin Liu, Hao-Xiang Guo, Hao Pan, Peng-Shuai Wang, Xin Tong, Yang Liu

来源：CVPR 2021

翻译：赵贝

审核:王志勇

摘要

点集广泛应用于3D 灵活轻量级的深度学习表达。然而，基于学习的形状生成方法，其离散特性不能表示连续和精细的几何形状。在这项工作中，论文引入了隐式移动最小二乘(IMLS)表面公式将离散点集转换为平滑表面，从本质上定义点集的局部隐函数。论文将 IMLS 以继承点集的灵活性和隐藏表面的高质量，将表面生成与深度神经网络相结合。提出的IMLSNet 预测八叉树结构作为在需要的地方生成 MLS 点脚手架，用学到的局部先验来表示形状几何。另外，一旦预测 MLS 我们的隐函数评估独立于神经网络，从而实现快速运行时的评估。我们对 3D 对象重建实验表明，IMLSNets 优于基于学习的最先进方法，重建质量和计算效率。广泛的消融测试也验证了我们的网络设计和损失函数。代码开源地址是

https://github.com/Andy97/DeepMLS

方法概述

1）深层IMLS表面

在实践中，稀疏和无方向点云可能有噪音和缺失区域 3D 典型的重建输入，但它们不能是传统的 3D 处理重建方法（如泊松重建）。为了处理这些不完美的数据，论文设计了一个自动编码的神经网络来生成IMLS 表面。

定义网络输出的简单方法是设置固定数量IMLS点元组{p_i , n_i , r_i }^N_i=1。然而，它会受到限制 IMLS 表达能力，不能很好地从数据中学习局部几何先验。为此，引入了基于八叉树的中间网络输出脚手架，以帮助生成 MLS 点。基于八叉树的支架是一个 d 深八叉树 O，它在多分辨率下粗略接近3D 表面。每个最好的非空八分圆 o_k，也就是说，八叉树中最小的非空体素，我们关联的一组位于八分圆中心附近c_k的 MLS 点。具体来说，和o_k相关的 MLS 点定义为以下公式：

其中t_k,l∈R³是从p_k,l到c_k偏移向量，s是点数的预定义。由于基于八叉树的支架结构取决于目标表面，因此自适应地确定 MLS 点的总数及其位置。

有了以上设置，一个适合 IMLS 基于八叉树的脚手架应输出生成的网络 O；(2)每一个最细的非空八分圆 o_k的MLS点偏移量、MLS点法线和控制半径，分别用t_k,l,n_k,l和r_k,l表示。

这里我们注意到，由输入噪声和稀疏点云创建的八叉树不能用作脚手架，因为它可能不完整和不准确，不同于目标形状的八叉树。

A、脚手架预测：基于八叉树的卷积神经网络(O-CNN)生成脚手架的自动编码器。其编码器由输入点云构建 d_in-depth 八叉树作为输入，只在八叉树中执行 CNN 计算。它的解码器从 4 × 4 × 4 在单元开始时，预测每个单元是否空，如果单元不空，则细分为八个八分圆。这一过程在每个非空八分圆上递归，直到八叉树深度最大输出d_out为止

B、MLS点预测：与之前的工作不同，解码器将定向点或平面补丁返回每个最细的非空八分圆，以实现亚体素精度，并根据八分圆的特点进行预测 s 个 MLS 点元组，表示为 f(ok)，通过带有隐藏层的多层传感器(MLP)，如下所示：

MLP预测p_k,l局部坐标，即t_k,l，因此，它可以从数据中学习局部先验。为保证p_k,l接近c_k，t_k,l每个坐标的重量取值范围限制在[βh,βh]这里h是最细的八分圆大小，β默认设置为1.5 . 另外将r_k,s限制在[l_r/2, 2l_r]内，其中l_r = h/√s。这些约束是通过使用网络输出来的 tanh 根据其范围比例实现激活和缩放值。

2）网络结构

类似的论文使用 U-Net 的 O-CNN 自动编码器，其中包含 O-CNN ResNet 跳过连接块和输出导向。对于给定的无方向点云，论文提出为其建造深八叉树。在每个最细的八分圆中，八分圆内输入点的平均位置的偏移和二进制标量的八分圆中心的偏移=连接设置输入 4 维信号，二进制标量指示八分圆是否为空。

网络结构如上图所示。Resblock(n, c)表示一个 n 层基于 O-CNN 通道编号的残余块 c。Downsample(c)和 Upsample(c)基于八叉树的卷积和反卷积算子[49] ReLU。对于第一个 Resblock，c 设置为而且在每一个 Downsample 之后增加算子 2 而且在每一个 Upsample 算子后除以 2。在论文实验中，论文设置 n = 3。隐藏层 MLP 预测八分圆是否为空。

3)损失函数设计

损失函数由以下项目组成：

A、八叉树结构损失

确定八分圆状态是一个二元分类问题：0代表空，1 代表非空。论文使用 O 每个八分圆处 sigmoid 加权要求和定义交叉熵损失的八叉树结构损失。

B、SDF损失

预测的IMLS表面和地面实际情况SDF由于场间的差异SDF损失L_sdf定义。

这里 F 梯度可近似：

C、MLS点排斥损失

用于改进生成 MLS 点的局部规律性。

其中 || p_i ? p_j||_proj = || (I?n_in^T_i )(p_i ?p_j) || 是p_i ? p_j在p_i切平面上的投影长度，w_ij是关于两个MLS点差和法向差的双边权重定义如下

上述设计将p_j推离p_i，特别是当他们的法线与他们的位置相似时。

D、损失投影平滑度

鼓励论文实现局部表面平滑度 MLS 靠近相邻点 MLS 点的切平面。

E、半径平滑度损失

同样，相邻的为了提高表面平滑度MLS通过加权拉普拉斯的平滑度来惩罚点的半径变化

F、权重衰减：在损失函数中添加一个小的权重衰减项，系数为λ_w

实验结果展示

1）重建结果展示

2）精度对比

3）消融分析

Abstract

Point set is a flexible and lightweight representation widely used for 3D deep learning. However, their discrete nature prevents them from representing continuous and fine geometry, posing a major issue for learning-based shape generation. In this work, we turn the discrete point sets into smooth surfaces by introducing the well-known implicit moving least-squares (IMLS) surface formulation, which nat- urally defines locally implicit functions on point sets. We incorporate IMLS surface generation into deep neural net- works for inheriting both the flexibility of point sets and the high quality of implicit surfaces. Our IMLSNet pre- dicts an octree structure as a scaffold for generating MLS points where needed and characterizes shape geometry with learned local priors. Furthermore, our implicit function eval- uation is independent of the neural network once the MLS points are predicted, thus enabling fast runtime evaluation. Our experiments on 3D object reconstruction demonstrate that IMLSNets outperform state-of-the-art learning-based methods in terms of reconstruction quality and computa- tional efficiency. Extensive ablation tests also validate our network design and loss functions.

本文仅做学术分享，如有侵权，请联系删文。

3D视觉精品课程推荐：

1.面向自动驾驶领域的多传感器数据融合技术

2.面向自动驾驶领域的3D点云目标检测全栈学习路线！(单模态+多模态/数据+代码)3.彻底搞透视觉三维重建：原理剖析、代码讲解、及优化改进4.国内首个面向工业级实战的点云处理课程5.激光-视觉-IMU-GPS融合SLAM算法梳理和代码讲解6.彻底搞懂视觉-惯性SLAM：基于VINS-Fusion正式开课啦7.彻底搞懂基于LOAM框架的3D激光SLAM: 源码剖析到算法优化8.彻底剖析室内、室外激光SLAM关键算法原理、代码和实战(cartographer+LOAM +LIO-SAM)

9.从零搭建一套结构光3D重建系统[理论+源码+实践]

10.单目深度估计方法：算法梳理与代码实现

11.自动驾驶中的深度学习模型部署实战

12.相机模型与标定(单目+双目+鱼眼）

13.重磅！四旋翼飞行器：算法与实战

重磅！3DCVer-学术论文写作投稿交流群已成立

扫码添加小助手微信，可申请加入3D视觉工坊-学术论文写作与投稿微信交流群，旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。

同时也可申请加入我们的细分方向交流群，目前主要有3D视觉、CV&深度学习、SLAM、三维重建、点云后处理、自动驾驶、多传感器融合、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流、ORB-SLAM系列源码交流、深度估计等微信群。

一定要备注：研究方向+学校/公司+昵称，例如：”3D视觉 + 上海交大 + 静静“。请按照格式备注，可快速被通过且邀请进群。原创投稿也请联系。

▲长按加微信群或投稿

▲长按关注公众号

3D视觉从入门到精通知识星球：针对3D视觉领域的视频课程（三维重建系列、三维点云系列、结构光系列、手眼标定、相机标定、激光/视觉SLAM、自动驾驶等）、知识点汇总、入门进阶学习路线、最新paper分享、疑问解答五个方面进行深耕，更有各类大厂的算法工程人员进行技术指导。与此同时，星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息，打造成集技术与就业为一体的铁杆粉丝聚集区，近4000星球成员为创造更好的AI世界共同进步，知识星球入口：

学习3D视觉核心技术，扫描查看介绍，3天内无条件退款

圈里有高质量教程资料、答疑解惑、助你高效解决问题

觉得有用，麻烦给个赞和在看~

资讯详情

用于3D重构的深层隐式移动最小二乘函数（CVPR 2021）

详细介绍电流互感器功能区别3CT SR ZCT

用于3D重构的深层隐式移动最小二乘函数（CVPR 2021）

详细介绍电流互感器功能区别3CT SR ZCT

最近热搜

历史搜索 清除历史记录

历史搜索清除历史记录