×

CAD2RL公司

swMATH ID: 35708
软件作者: 谢尔盖·莱文(Sergey Levine),费雷什·萨德吉(Fereshteh Sadeghi)
描述: CAD2RL:Real Single-Image Flight without a Single Real Image,Deep reinforcement learning已成为一种有前途的强大技术,用于自动获取控制策略,该策略可以处理原始感官输入,如图像,并执行复杂行为。然而,将深度RL扩展到现实世界中的机器人任务已被证明具有挑战性,尤其是在安全关键领域,如自动飞行,在这些领域,尝试和错误学习过程通常是不切实际的。在本文中,我们探讨了以下问题:我们是否可以完全在仿真中训练基于视觉的导航策略,然后将其转移到现实世界中,从而在没有单个真实训练图像的情况下实现真实飞行?我们提出了一种称为CAD2RL的学习方法,该方法可以用于在真实世界中执行无碰撞的室内飞行,同时完全基于3D CAD模型进行训练。我们的方法使用单目相机的单个RGB图像,无需显式重建环境的3D几何体或执行显式运动规划。我们学习的碰撞避免策略由深度卷积神经网络表示,该网络直接处理原始单目图像并输出速度命令。该策略完全基于模拟图像进行训练,使用蒙特卡罗策略评估算法直接优化网络生成无碰撞飞行的能力。通过对模拟训练集的渲染设置进行高度随机化,我们表明可以训练一种适用于现实世界的策略,而不需要模拟器特别逼真或高保真。我们通过在室内环境中飞行真实的四旋翼来评估我们的方法,并通过一系列关于深度预测的消融研究进一步评估模拟器中的设计选择。有关补充视频,请参阅:此https URL
主页: https://arxiv.org/abs/1611.04201
相关软件: NDDS公司;斯蒂勒本;零MQ;ImageNet公司;亚当;BlenderProc公司;搅拌机;蟒蛇;PyTorch公司;混合火炬
引用于: 0个文档