利用GNC算法改进机器人感知-MATLAB和Simulink

当Vasileios Tzoumas麻省理工学院（麻省理工学院），访问一个新城市，他喜欢通过跑步来探索。有时他会迷路。几年前，从长远来看，在大阪参加一次会议时，不可避免地发生了这种情况。但随后，Tzoumas发现了一辆他记得在离开酒店后不久路过的7-11。这一认知使他能够在精神上“闭合回路”，将自己人生轨迹的松散一端连接到他知道并确信的某个地方，从而巩固了他的思维图谱，并使他能够返回酒店。

分级非凸（GNC）算法可以帮助机器穿越陆地、水域、天空和太空，然后回来讲述故事。

闭合回路实际上是机器人在新环境中导航时经常要做的一个技术术语。这是一个称为同步定位和映射（SLAM）.SLAM不是新的。它被用于机器人吸尘器、自动驾驶汽车、搜索和救援无人机，以及工厂、仓库和矿山的机器人。当自动装置和车辆在新的空间中导航时，从客厅到天空，它们会在行进中绘制地图。他们还必须使用摄像头、GPS和激光雷达等传感器来确定自己在地图上的位置。

随着SLAM发现更多的应用程序，确保SLAM算法在具有挑战性的现实条件下产生正确的结果比以往任何时候都重要。SLAM算法通常在完美的传感器或受控的实验室条件下运行良好，但在现实世界中使用不完美的传感器时，它们很容易丢失。不出所料，工业客户经常担心他们是否可以信任这些算法。

麻省理工学院（MIT）的研究人员开发了几种强大的SLAM算法，以及从数学上证明我们可以信任它们的方法。麻省理工学院莱昂纳多职业发展助理教授卢卡·卡隆的实验室发表论文关于他们的分级非凸性（GNC）算法，该算法减少了SLAM结果中的随机误差和不确定性。更重要的是，该算法在现有方法“丢失”的情况下产生正确的结果。该论文由Carlone、Tzoumas和Carlone的学生Heng Yang和Pasquale Antonante撰写，在国际机器人与自动化会议（ICRA）上获得机器人视觉最佳论文奖。这个GNC算法将帮助机器穿越陆地、水域、天空和太空，然后回来讲述故事。

一切都是一致的

机器人的感知依赖于传感器，传感器通常会提供噪音或误导性输入。麻省理工学院的GNC算法允许机器人决定信任哪些数据点，丢弃哪些数据点。GNC算法的一个应用程序称为形状对齐机器人使用2D相机图像估计汽车的3D位置和方向。机器人接收到一个摄像头图像，其中包含许多由特征检测算法标记的点：前照灯、车轮、镜子。它的内存中还有一个汽车的3D模型。目标是缩放、旋转和放置三维模型，使其特征与图像中的特征对齐。Carlone说：“如果特征检测算法做得很好，这很容易，但事实很少如此。”。在实际应用中，机器人面临许多离群值——标记错误的特征——这些特征可能占所有观测值的90%以上。这就是GNC算法的用武之地，它超越了所有竞争对手。

机器人使用一个数学函数来解决这个问题，该函数考虑了每对特征之间的距离，例如，图像中的右前照灯和模型中的右前灯。他们试图“优化”此功能，以确定模型的方向，从而最小化所有这些距离。功能越多，问题就越难解决。

解决这个问题的一种方法是尝试所有可能的函数解决方案，看看哪一个最有效，但有太多的方法要尝试。杨和安东南特解释说，一种更常见的方法是“尝试一种解决方案，不断进行微调，例如，模型中的头灯与2D图像中的头照灯更加对齐，直到你无法再对其进行改进。”，如果车头灯对齐，但车轮不对齐，这不会是完美的，因此您可以重新开始使用另一个解决方案，并尽可能完善该解决方案，重复该过程数次，以找到最佳结果。然而，找到最佳解决方案的可能性很小。

在实际应用中，机器人面临许多异常值，这些异常值可能占所有观测值的90%以上。这就是GNC算法的用武之地，它超越了所有竞争对手。

GNC算法可以找到最优的对齐方式，尽管存在高达70-90%的异常值的噪声测量。图片来源：麻省理工学院。

GNC背后的理念是首先简化问题。他们减少了他们试图优化的功能，即描述3D模型和2D图像之间差异的功能，以一个最佳解决方案。现在，当他们选择一个解决方案并推动它时，他们最终会找到最好的解决方案。然后，他们重新引入了一点原始函数的复杂性，并改进了刚刚找到的解决方案。他们一直这样做，直到得到原始函数及其最优解。车头灯对齐，车轮和保险杠也对齐。

绕圈而行

本文将GNC算法应用于形状对齐和SLAM等问题。在SLAM的情况下，机器人使用传感器数据计算其过去的轨迹并构建地图。例如，一个在大学校园里漫游的机器人收集里程计数据，这些数据表明它在上午8:00至8:15、8:15至8:30之间行驶了多远和方向，以此类推。它还拥有上午8:00、8:15的激光雷达和相机数据有时，它会完成循环，在两个不同的时间看到相同的东西，就像Tzoumas再次跑过7-11一样。

研究人员发现，GNC算法比最新技术更准确，可以处理更高百分比的异常值。

就像形状对齐一样，还有一个优化问题需要解决。杨是论文的第一作者，他解释说：“对于SLAM，系统不是排列特征来匹配3D模型，而是弯曲它认为它穿过的轨迹，以便在地图上对齐对象。”首先，系统努力将不同传感器感知到的行程之间的差异降到最低，因为每个传感器都可能有测量误差。例如，如果机器人的里程表显示它在上午8:00⁄am到上午8:15⁄am之间行驶了100米，则基于激光雷达和相机测量值更新的轨迹应反映该距离或其附近的距离。系统还将相同位置之间的距离最小化。如果机器人在上午8:00和上午10:00看到相同的7-Eleven，则算法将尝试弯曲回忆的轨迹，调整每条腿，使其回忆的位置在上午8:00-和上午10⁄时对齐，从而关闭循环。

机器人绘制建筑物内部的地图。GNC逐渐解开混乱的数据。在相对较少的步骤中，该算法可以获得建筑物内部的精确地图。图片来源：麻省理工学院。

同时，该算法识别并丢弃了异常值，即错误数据点，它认为这是在回溯其步骤，但事实并非如此，就像形状对齐中的错误标记特征一样。你不想错误地关闭循环。Tzoumas回忆起一段时间，他穿过缅因州的树林，路过一堆看起来很熟悉的倒下的树干。他以为自己已经结束了循环，利用这个所谓的地标，他转弯了。只有在20分钟没有看到其他熟悉的东西后，他才怀疑自己的错误并回头。

优化前的回忆轨迹可能看起来像一个缠结的绳团。解开纠缠后，它就像一组直角线，反映了机器人穿过的校园小径和走廊的形状。此SLAM过程的技术术语是位姿图优化.

在本文中，研究人员将其GNC算法与其他算法在几个应用中进行了比较，包括形状对齐和姿势图优化。他们发现他们的方法比最先进的技术更准确，可以处理更高比例的异常值。对于SLAM，即使四个循环闭包中有三个是错误的，它仍然有效，这比它在实际应用程序中遇到的异常值要多得多。此外，他们的方法通常比其他算法更有效，需要更少的计算步骤。Tzoumas说，“其中一个困难是找到一种通用算法，它能在许多应用程序中很好地工作。”杨说，他们已经在10多个应用程序上试用过。Tzoumas说，最终他们找到了“最甜蜜的地方”

GNC算法正确地重建了麻省理工学院大圆顶内部的地图。 — MATLAB根据机器人割草的数据生成地图。左图：草坪原始地图。中间：使用常见SLAM算法优化地图，其中包括来自未知离群值循环闭包的错误标记数据。右：使用GNC算法优化的地图。

MathWorks的机器人研究科学家Roberto G.Valenti表示，从研究到生产是研究成果在规模上产生影响的重要一步。MathWorks一直在与Carlone的实验室合作，将GNC算法集成到MATLAB中，作为Navigation Toolbox™的一部分，公司使用该工具箱在商业和工业自治系统上实现SLAM。

走出森林

Carlone的实验室正在研究如何扩展GNC算法的功能。例如，杨的目标是设计可以证明正确的感知算法。Antonante正在寻找方法来管理不同算法之间的不一致性：如果自动车辆中的SLAM模块说道路是笔直的，而车道检测模块说道路向右转弯，那么你就有问题了。

GNC算法是允许机器人捕捉自己错误的新基准。

Tzoumas正在研究如何扩大规模，不仅仅是一个机器人中多个算法之间的交互，而是多个机器人之间的协作。在早些时候的工作中，他将无人驾驶飞机编程为跟踪目标，例如试图步行或驾车逃跑的罪犯。展望未来，多台机器可能会共同运行GNC算法。每一方都会向其邻国提供部分信息，并共同在地球或其他地方绘制全球地图。今年，他将转到密歇根大学航空航天工程系，致力于在战场和其他行星等困难环境中为多机器人规划和自主导航提供可靠的自主性。

Antonante说：“不知道人工智能和感知算法的行为方式对使用它们是一个巨大的阻碍。”。他指出，如果机器人博物馆导览员有可能撞上游客或蒙娜丽莎，他们将不被信任：“你希望你的系统对环境和自身都有深入的了解，这样它就可以捕捉自己的错误。”GNC算法是允许机器人捕捉自己错误的新基准，并且，最重要的是，正如Tzoumas所说，“它能帮助你走出困境。”