基于高斯过程和神经控制收缩度量的不确定性安全勘探规划

Dawei Sun、Mohammad Javad Khojasteh、Shubhanshu Shekhar、Chuchu Fan
第三届动力学和控制学习会议记录,PMLR 144:728-7412021年。

摘要

在非结构化、复杂和不断变化的现实世界环境中操作的机器人应在收集有关其环境的数据并更新其模型动力学的同时导航并保持安全。在本文中,我们考虑使用机器人探索对动力学和禁区具有未知、状态相关干扰的环境的问题。机器人的目标是安全地收集扰动的观测值,并对潜在功能进行准确估计。我们使用高斯过程从回归误差具有高置信界的数据中估计干扰。此外,基于对扰动的估计,我们使用神经收缩度量来推导跟踪控制器以及围绕机器人规划的标称轨迹的相应高置信不确定度管。根据收缩度量的鲁棒性,可以预先计算误差边界,并由运动规划器使用,从而保证实际轨迹是安全的。

引用本文


BibTeX公司
@会议记录{pmlr-v144-sun21a,title={使用高斯过程和神经控制收缩度量的不确定感知安全勘探规划},author={Sun、Dawei和Khojasteh、Mohammad Javad和Shekhar、Shubhanshu和Fan、Chuchu},booktitle={第三届动力学和控制学习会议记录},页数={728--741},年份={2021},editor={贾巴比、阿里和莱杰罗斯、约翰和帕帕斯、乔治J.和A.帕里罗、巴勃罗和雷希特、本杰明和汤姆林、克莱尔J.和泽林格、梅兰妮N.},体积={144},series={机器学习研究论文集},月={07--08年6月},publisher={PMLR},pdf={http://proceedings.mlr.press/v144/sun21a/sun21a.pdf},url={https://proceedings.mlr.press/v144/sun21a.html},抽象={机器人在非结构化、复杂和不断变化的现实世界环境中工作时,应在收集有关其环境的数据并更新其模型动力学时导航并保持安全。在本文中,我们考虑使用机器人探索对动力学具有未知、状态相关干扰的环境的问题,并禁止n个区域。机器人的目标是安全地收集扰动的观测值,并对潜在功能进行准确估计。我们使用高斯过程从回归误差具有高置信界的数据中估计干扰。此外,基于对扰动的估计,我们使用神经收缩度量来推导跟踪控制器以及围绕机器人规划的标称轨迹的相应高置信不确定度管。从收缩度量的鲁棒性出发,运动规划器可以预先计算误差界并加以使用,从而确保实际轨迹是安全的。}}
尾注
%0会议论文%基于高斯过程和神经控制收缩度量的T不确定性安全勘探规划%孙大伟%穆罕默德·贾瓦德·科贾斯特%A Shubhanshu Shekhar先生%A楚楚扇%B第三届动力学和控制学习会议记录%C机器学习研究进展%D 2021年%E阿里·贾德巴比%E约翰·利格罗斯%E乔治·J·帕帕斯%E巴勃罗·帕里罗%E本杰明·雷希特%E克莱尔·汤姆林%E梅兰妮·泽林格%F pmlr-v144-sun21a型%我PMLR%电话728--741%U型https://proceedings.mlr.press/v144/sun21a.html%V 144型%在非结构化、复杂和不断变化的现实世界环境中操作的X机器人应在收集环境数据和更新模型动态的同时导航并保持安全。在本文中,我们考虑使用机器人探索对动力学和禁区具有未知、状态相关干扰的环境的问题。机器人的目标是安全地收集扰动的观测值,并对潜在功能进行准确估计。我们使用高斯过程从回归误差具有高置信界的数据中估计干扰。此外,基于对扰动的估计,我们使用神经收缩度量来推导跟踪控制器以及围绕机器人规划的标称轨迹的相应高置信不确定度管。从收缩度量的鲁棒性出发,运动规划器可以预先计算误差界并加以使用,从而保证实际轨迹的安全性。
阿帕
Sun,D.、Khojasteh,M.J.、Shekhar,S.和Fan,C.(2021)。使用高斯过程和神经控制收缩度量的不确定感知安全勘探规划。第三届动力学和控制学习会议记录,英寸机器学习研究进展144:728-741可从https://proceedings.mlr.press/v144/sun21a.html。

相关材料