Regret Bounds for Adaptive Nonlinear Control

Nicholas M. Boffi; Stephen Tu; Jean-Jacques E. Slotine

自适应非线性控制的后悔界

尼古拉斯·博菲、斯蒂芬·图、珍妮·雅克·斯隆

第三届动力学和控制学习会议记录，PMLR 144:471-4832021年。

摘要

我们研究了一个已知离散非线性系统在未建模扰动下的自适应控制问题。我们证明了随机环境中具有匹配不确定性的自适应非线性控制的第一个有限时间后悔界，表明确定性等价自适应控制与完全了解未建模扰动的预言控制器相比，其后悔上界为$widetilde{O}（sqrt{T}）预计为美元。此外，我们还表明，当输入受到k个时间步长的延迟时，遗憾降级为$\widetilde{O}（k\sqrt{T}）$。我们的分析将非线性控制理论中的经典稳定性概念（Lyapunov稳定性和收缩理论）与在线凸优化中的现代后悔分析联系起来。利用稳定性理论，我们可以分析具有挑战性的无限深单轨道设置。

引用本文

BibTeX公司

@会议记录{pmlr-v144-boffi21a，title={自适应非线性控制的后悔界限}，author={波菲、尼古拉斯·M·和图、斯蒂芬和斯隆、珍妮·雅克·E·}，booktitle={第三届动力学和控制学习会议记录}，页数={471--483}，年份＝{2021}，editor={贾巴比、阿里和莱杰罗斯、约翰和帕帕斯、乔治J.和A.帕里罗、巴勃罗和雷希特、本杰明和汤姆林、克莱尔J.和泽林格、梅兰妮N.}，体积={144}，series={机器学习研究论文集}，月={07--08年6月}，publisher={PMLR}，pdf={http://proceedings.mlr.press/v144/boffi21a/boffi21a.pdf},url={https://proceedings.mlr.press/v144/boffi21a.html},抽象=｛我们研究了一个已知的离散时间非线性系统在未建模扰动下的自适应控制问题。我们证明了随机环境下具有匹配不确定性的自适应非线性控制的第一个有限时间后悔界，表明确定性等价自适应控制所遭受的后悔与预言机相比控制器对未建模扰动有很好的了解，预期其上边界为$\widetilde{O}（\sqrt{T}）$。此外，我们还表明，当输入受到k个时间步长的延迟时，遗憾降级为$\widetilde{O}（k\sqrt{T}）$。我们的分析将非线性控制理论中的经典稳定性概念（Lyapunov稳定性和收缩理论）与在线凸优化中的现代后悔分析联系起来。利用稳定性理论，我们可以分析具有挑战性的无限深单轨道设置。}}

尾注

%0会议论文%自适应非线性控制的T遗憾界%尼古拉斯·M·波菲%屠呦呦%Jean-Jacques E.Slotine牛仔裤%B第三届动力学和控制学习会议记录%C机器学习研究进展%D 2021年%E阿里·贾德巴比%E约翰·利格罗斯%E乔治·J·帕帕斯%E巴勃罗·帕里罗%E本杰明·雷希特%E克莱尔·汤姆林%E梅兰妮·泽林格%对于pmlr-v144-boffi21a%我PMLR%第471--483页%U型https://proceedings.mlr.press/v144/boffi21a.html%V 144型%我们研究了一个已知离散非线性系统在未建模扰动下的自适应控制问题。我们证明了随机环境中具有匹配不确定性的自适应非线性控制的第一个有限时间后悔界，表明确定性等价自适应控制与完全了解未建模扰动的预言控制器相比，其后悔上界为$widetilde{O}（sqrt{T}）预计为美元。此外，我们表明，当输入受到k个时间步长的延迟时，遗憾降到$\widetilde{O}（k\sqrt{T}）$。我们的分析将非线性控制理论中的经典稳定性概念（Lyapunov稳定性和收缩理论）与在线凸优化中的现代后悔分析联系起来。利用稳定性理论，我们可以分析具有挑战性的无限深单轨道设置。

阿帕

Boffi，N.M.、Tu，S.和Slotine，J.E.（2021）。自适应非线性控制的遗憾界。第三届动力学和控制学习会议记录，英寸机器学习研究进展144:471-483网址：https://proceedings.mlr.press/v144/boffi21a.html。

自适应非线性控制的后悔界

摘要

引用本文

相关材料