自适应非线性控制的后悔界
尼古拉斯·博菲、斯蒂芬·图、珍妮·雅克·斯隆
第三届动力学和控制学习会议记录,PMLR 144:471-4832021年。
摘要
我们研究了一个已知离散非线性系统在未建模扰动下的自适应控制问题。我们证明了随机环境中具有匹配不确定性的自适应非线性控制的第一个有限时间后悔界,表明确定性等价自适应控制与完全了解未建模扰动的预言控制器相比,其后悔上界为$widetilde{O}(sqrt{T})预计为美元。此外,我们还表明,当输入受到k个时间步长的延迟时,遗憾降级为$\widetilde{O}(k\sqrt{T})$。我们的分析将非线性控制理论中的经典稳定性概念(Lyapunov稳定性和收缩理论)与在线凸优化中的现代后悔分析联系起来。利用稳定性理论,我们可以分析具有挑战性的无限深单轨道设置。
引用本文
相关材料