资讯详情

【AI视野·今日Robot 机器人论文速览 第三十一期】Fri, 15 Apr 2022

AI视野·今日CS.Robotics 机器人论文速读 Fri, 15 Apr 2022 Totally 14 papers ???更精彩请移动主页

在这里插入图片描述

Daily Robotics Papers

An Integrated Design Pipeline for Tactile Sensing Robotic Manipulators Authors Lara Zlokapa, Yiyue Luo, Jie Xu, Michael Foshey, Kui Wu, Pulkit Agrawal, Wojciech Matusik传统的机器人机械手设计方法需要大量、耗时和手动试错才能产生可行的设计。在这个过程中,工程师经常花时间重新设计或重塑组件,因为他们发现机器人操纵器有更好的拓扑结构。虽然触觉传感器很有用,但由于其巨大的外观尺寸,通常会使设计复杂化。为了简化机器人机械手的设计和制造,我们提出了一个集成的设计过程。通过应用预定义的图形语法规则,允许设计师组装一组模块化的开源组件。最终的结果是一个直观的设计例子,允许在几分钟内创建新的机械手虚拟设计。我们的框架允许设计师根据笼的几何变形微调机械手的形状。最后,设计师可以选择添加触觉感应表面。机械手设计完成后,程序将自动生成3D打印和编织文件。

GelSight Fin Ray: Incorporating Tactile Sensing into a Soft Compliant Robotic Gripper Authors Sandra Q. Liu, Edward H. Adelson为了适应不断变化的环境,保证人机交互的安全,机器人应该顺从柔软,并有能力感知周围的世界。即便如此,由于其可变结构,触觉感应与柔软的顺应机器人(如 Fin Ray 手指)仍然很难。为了实现复杂的触觉感应,机器人还必须保持其原始的机械兼容性。然而,由于许多传感器手指(如基于软手指的高分辨率触觉传感器),很难为软手指添加高分辨率触觉传感器 GelSight 手指)刚性,传感区域的变化仅来自触觉接触,而不是手指顺应性假设。传感软机器人的手指需要能够将其整体感觉变化与其触觉信息分开。为此,本文介绍了 GelSight Fin Ray 新颖的设计不仅反映了被动适应其捕获任何物体的能力,而且具有执行高分辨率触觉重建、物体方向估计、剪切和扭转标记跟踪的能力。军队。有了这些功能,柔软顺从的机器人可以执行更多需要感应的操作任务。手指可以成功执行的一项任务是重新定向和放置厨房任务酒杯,这对外部视觉传感器来说很难做到,但对触觉感应却很容易。

Sim-to-Real 6D Object Pose Estimation via Iterative Self-training for Robotic Bin-picking Authors Kai Chen, Rui Cao, Stephen James, Yichuan Li, Yun Hui Liu, Pieter Abbeel, Qi Dou本文从 sim 到真实 6D 对象态度估计,以促进机器人抓取的成本效益。为了给出垃圾箱拾取场景,我们建立了一个逼真的模拟器来合成大量的虚拟数据,并初始态度。然后,该网络扮演教师模型的角色,生成未标记的真实数据的姿势预测。通过这些预测,我们进一步设计了一个全面的自适应选择来区分可靠的结果,并将其用作更新学生模型的伪标签,以便在真实数据中进行姿态估计。为了不断提高伪标签的质量,我们将培训好的学生模型迭代为新教师,并使用详细的教师模型重新标记真实数据。我们在公共基准和新发布的数据集中评估了我们的方法 11.49 和 22.62 的 ADD S 改进。

Blending Primitive Policies in Shared Control for Assisted Teleoperation Authors Guilherme Maeda运动原语具有适应机器人状态变化的特性,同时保持对原始策略的吸引力。因此,我们研究使用原语作为混合机制,通过考虑与原策略的状态偏差是由用户输入引起的。当原语从用户输入中恢复时,它隐含地将人类和机器人策略与仲裁相结合,而不需要它们的权重。本文采用动态运动原语 DMP,这使可以避免多次演示的需要,而且速度足够快,可以实现大量的实例化,每个实例对应人类意图的每一个假设。介绍了辅助远程操作任务的用户研究,以实现多个目标和动态避障。

NASA/GSFC's Flight Software Core Flight System Implementation For A Lunar Surface Imaging Mission Authors Mohammed Eleffendi, Daniel Posada, M. Ilhan Akbas, Troy Henderson随着新的临界点技术提供了重返月球进行研究和探索的可能性,人们对重返月球的研究和探索越来越感兴趣。其中一项措施是 NASA 的 Artemis 计划,计划在 2024 年之前将人类送回月球表面并研究月球表面的水沉积物。该计划还将派人类探索火星作为实际操作的物流工作。为了使人类安全地返回月球,需要一些关于月球表面性质的技术进步和多样化知识。本文将讨论 EagleCam 这是飞行软件的设计和实现 CubeSat 基于相机系统 NASA 戈达德太空飞行中心开发的免费开源核心 Flight System cFS 架构。 EagleCam 是由 Intuitive Machines 商业月球有效负荷服务的开发 Nova C 着陆器运输到月球的有效载荷。相机系统将捕捉执行月球着陆的航天器的第一、第三人称视角,并收集羽流与表面相互作用等其他科学数据。完整的系统由 CubeSat 部署程序组成弹出。

Federated Learning for Vision-based Obstacle Avoidance in the Internet of Robotic Things Authors Xianjia Yu, Jorge Pe a Queralta, Tomi Westerlund深度学习方法彻底改变了移动机器人技术,从增强态势感知的高级感知模型到加强学习的新颖控制方法。本文探讨了联邦学习在移动机器人分布式系统中实现机器人物联网合作的潜力。为了证明这种方法的有效性,我们在不同的室内环境中部署了轮式机器人。我们分析了联邦学习方法的性能,并将其与传统的先验聚合数据集中训练过程进行了比较。从模拟到真实知识转移,我们展示了跨异构环境合作学习的好处和潜力。我们的结果证明了 FL 和 sim 除了保持边缘的计算外,基于视觉导航的实际传输还具有显著的性能优势 FL 固有隐私保护性质。

GloCAL: Glocalized Curriculum-Aided Learning of Multiple Tasks with Application to Robotic Grasping Authors Anil Kurkcu, Cihan Acar, Domenico Campolo, Keng Peng Tee由于需要大量数据并确保学习过程中的安全性,机器人领域对应用深度强化学习具有挑战性。课程学习在样本高效深度学习方面表现出良好的表现。在本文中,我们提出了一种名为 GloCAL 的算法,该算法基于根据评估分数对任务进行聚类,为代理创建学习多个离散任务的课程。从性能最高的集群中,识别出代表集群的全局任务,用于学习全局策略,该策略会转移到随后形成的新集群,而集群中的剩余任务则作为本地策略进行学习。我们的 GloCAL 算法的功效和效率与 EGAD 数据集中具有不同对象复杂性和抓取难度的 49 个对象的抓取学习领域中的其他方法进行了比较。

MARF: Multiscale Adaptive-switch Random Forest for Leg Detection with 2D Laser Scanners Authors Tianxi Wang, Feng Xue, Yu Zhou, Anlong Ming对于基于 2D 激光的任务,例如人员检测和人员跟踪,腿部检测通常是第一步。因此,它在确定人员检测和人员跟踪的性能方面具有重要意义。然而,许多腿部检测器忽略了不可避免的噪声和激光扫描的多尺度特性,这使得它们对点云的不可靠特征敏感,进一步降低了腿部检测器的性能。在本文中,我们提出了一种多尺度自适应开关随机森林 MARF 来克服这两个挑战。首先,自适应开关决策树被设计为使用噪声敏感特征进行加权分类,使用噪声不变特征进行二元分类,这使得我们的检测器对噪声具有更强的鲁棒性。其次,考虑到二维点云的稀疏性与激光束长度成正比的多尺度特性,我们设计了一种多尺度随机森林结构来检测不同距离的腿。此外,所提出的方法使我们能够从点云中发现比其他方法更稀疏的人腿。因此,与具有挑战性的移动腿数据集上的其他最先进的腿检测器相比,我们的方法显示出改进的性能,并在低计算笔记本电脑上以 60 FPS 的速度保留了整个管道。

Approximating Constraint Manifolds Using Generative Models for Sampling-Based Constrained Motion Planning Authors Cihan Acar, Keng Peng Tee在任务约束下进行基于采样的运动规划具有挑战性,因为配置空间中的零测量约束流形使得拒绝采样即使不是不可能也非常低效。本文提出了一种基于学习的采样策略,用于约束运动规划问题。我们研究使用两个众所周知的深度生成模型,条件变分自动编码器 CVAE 和条件生成对抗网络 CGAN 来生成满足样本配置的约束。我们使用以约束参数为条件的生成模型来逼近约束流形,而不是预先计算的图。这种方法允许在线有效地绘制满足样本的约束,而无需修改可用的基于采样的运动规划算法。我们根据采样精度和采样分布的覆盖范围来评估这两个生成模型的效率。

Control-oriented meta-learning Authors Spencer M. Richards, Navid Azizan, Jean Jacques Slotine, Marco Pavone实时适应对于控制在复杂、动态环境中运行的机器人至关重要。自适应控制律甚至可以赋予非线性系统良好的轨迹跟踪性能,前提是任何不确定的动力学项都可以通过已知的非线性特征进行线性参数化。然而,通常很难先验地指定这些特征,例如旋翼飞机上的空气动力干扰或机械臂与各种物体之间的相互作用力。在本文中,我们转向使用神经网络的数据驱动建模,从过去的数据中离线学习具有这些非线性特征的内部参数模型的自适应控制器。我们的主要见解是,我们可以通过闭环模拟中面向控制的元学习特征更好地准备控制器进行部署,而不是使用面向回归的特征元学习来拟合输入输出数据。具体来说,我们以闭环跟踪模拟为基础学习器,以平均跟踪误差为元目标来元学习自适应控制器。

Observability Analysis of Visual-Inertial Odometry with Online Calibration of Velocity-Control Based Kinematic Motion Models Authors Haolong Li, Joerg Stueckler在本文中,我们使用具有基于速度控制的运动学运动模型的立体相机分析了视觉惯性里程计 VIO 的可观察性。以前的工作表明,在一般情况下,在 VIO 系统中全局位置和偏航是不可观测的,此外,如果没有旋转,滚动和俯仰也变得不可观测。我们证明,通过整合平面运动约束,滚动和俯仰变得可观察。

Copiloting Autonomous Multi-Robot Missions: A Game-inspired Supervisory Control Interface Authors Marcel Kaufmann, Robert Trybula, Ryan Stonebraker, Michael Milano, Gustavo J. Correa, Tiago S. Vaquero, Kyohei Otsu, Ali akbar Agha mohammadi, Giovanni Beltrame新技术和能力的现实世界部署可能令人生畏。例如,最近的 DARPA Subterranean SubT Challenge 旨在通过为期三年的开发推动推进机器人平台和自主能力。虽然多代理系统传统上部署在允许进行受控测试的受控和结构化环境(例如仓库)中,但 SubT 挑战针对的是各种类型的未知地下环境,这些环境在发生故障时会带来机器人丢失的风险。在这项工作中,我们介绍了一个受视频游戏启发的界面、一个自主任务助手,并在具有挑战性的环境中使用异构多代理系统进行测试和部署。

Accelerated Policy Learning with Parallel Differentiable Simulation Authors Jie Xu, Viktor Makoviychuk, Yashraj Narang, Fabio Ramos, Wojciech Matusik, Animesh Garg, Miles Macklin深度强化学习可以生成复杂的控制策略,但需要大量的训练数据才能有效工作。最近的工作试图通过利用可微分模拟器来解决这个问题。然而,诸如局部最小值和爆炸消失的数值梯度等固有问题阻止了这些方法普遍应用于具有复杂接触丰富动力学的控制任务,例如经典 RL 基准中的人形运动。在这项工作中,我们提出了一种高性能的可微分模拟器和一种新的策略学习算法 SHAC,即使在不平滑的情况下也可以有效地利用模拟梯度。我们的学习算法通过平滑的批评函数缓解局部最小值问题,避免通过截断的学习窗口消失梯度爆炸,并允许许多物理环境并行运行。我们在经典的 RL 控制任务上评估我们的方法,并显示在样本效率和挂钟时间方面比最先进的 RL 和基于可微分模拟的算法有显着改进。

A Study of Causal Confusion in Preference-Based Reward Learning Authors Jeremy Tien, Jerry Zhi Yang He, Zackory Erickson, Anca D. Dragan, Daniel Brown通过基于偏好的奖励学习来学习机器人策略是一种越来越流行的定制机器人行为的方法。然而,近年来,越来越多的轶事证据表明,从偏好中学习奖励函数容易产生虚假的相关性和奖励游戏或黑客行为。虽然在直接从状态映射到动作的强化学习和模仿学习方法中,对因果混淆和奖励游戏行为有很多轶事、经验和理论分析,但我们在学习奖励函数的背景下提供了对因果混淆的第一个系统研究从偏好。为了促进这项研究,我们确定了一组三个偏好学习基准域,当从成对轨迹偏好的离线数据集中学习一个简单的到达域、一个辅助喂养域和一个抓痒域时,我们观察到了因果混淆。为了深入了解这种观察到的因果混淆,我们提出了一个敏感性分析,探讨了不同因素的影响,包括训练数据的类型、奖励模型容量和特征维度对从偏好中学习到的奖励的稳健性的影响。我们发现有证据表明,从成对轨迹偏好中学习奖励对虚假特征和增加的模型容量高度敏感且不鲁棒,但对训练数据的类型不敏感。

Chinese Abs From Machine Translation

Papers from arxiv.org

更多精彩请移步主页


pic from pexels.com

标签: abs轮速传感器被动式002

锐单商城拥有海量元器件数据手册IC替代型号,打造 电子元器件IC百科大全!

锐单商城 - 一站式电子元器件采购平台