利用参数空间法进行控制器设计的安全贝叶斯优化

Lorenz Dörschel、David Stenger、Dirk Abel
第三届动力学和控制学习会议记录,PMLR 144:299-311,2021。

摘要

随着控制系统变得越来越复杂,近年来,利用贝叶斯优化对控制参数进行优化调整的研究越来越引起人们的兴趣。安全贝叶斯优化(Safe Bayesian Optimisation)试图防止不安全参数化的采样,因此允许在现实世界的实验中进行参数调整。通常,这是通过使用概率GPR预测近似一个安全集来实现的。与此相反,通过参数空间方法获得了关于鲁棒稳定参数配置的分析知识,然后将其作为约束纳入优化中。在具有不确定参数的线性系统上的仿真结果表明,与标准方法相比,该方法具有显著的性能增益。

引用本文


BibTeX公司
@会议记录{pmlr-v144-dorschel21a,title={利用参数空间方法进行控制器设计的安全贝叶斯优化},author={D\“orschel,Lorenz和Stenger,David和Abel,Dirk},booktitle={第三届动力学和控制学习会议记录},pages={299-311},年份={2021},editor={贾巴比、阿里和莱杰罗斯、约翰和帕帕斯、乔治J.和A.帕里罗、巴勃罗和雷希特、本杰明和汤姆林、克莱尔J.和泽林格、梅兰妮N.},体积={144},series={机器学习研究论文集},月={07--08年6月},publisher={PMLR},pdf={http://processes.mlr.press/v144/dorschel21a/dorschel21a.pdf},url={https://procedures.mlr.press/v144/dorschel21a.html},抽象={随着控制系统变得越来越复杂,近年来,使用贝叶斯优化对控制参数进行优化调整的研究引起了越来越多的关注。安全贝叶斯最优化试图防止不安全参数的采样,因此允许在实际实验中进行参数调整。通常,这是通过以下方式实现的使用概率GPR预测逼近安全集。与此相反,通过参数空间方法获得了关于鲁棒稳定参数配置的分析知识,然后将其作为约束纳入优化中。在具有不确定参数的线性系统上的仿真结果显示,与标准方法相比,具有显著的性能增益。}}
尾注
%0会议论文%利用参数空间法进行控制器设计的T安全贝叶斯优化%A Lorenz Dörschel先生%大卫·斯坦格%德克·阿贝尔%B第三届动力学和控制学习会议记录%C机器学习研究进展%D 2021年%E阿里·贾德巴比%E John Lygeros公司%E乔治·J·帕帕斯%E巴勃罗·帕里罗%E本杰明·雷希特%E克莱尔·J·汤姆林%E梅兰妮·泽林格%F pmlr-v144-dorschel21a型%我PMLR%电话299--311%单位https://proceedings.mlr.press/v144/dorschel21a.html%V 144型%随着控制系统变得越来越复杂,近年来,使用贝叶斯优化对控制参数进行优化调整的研究引起了越来越多的兴趣。安全贝叶斯优化(Safe Bayesian Optimisation)试图防止不安全参数化的采样,因此允许在现实世界的实验中进行参数调整。通常,这是通过使用概率GPR预测近似一个安全集来实现的。与此相反,通过参数空间方法获得了关于鲁棒稳定参数配置的分析知识,然后将其作为约束纳入优化中。在具有不确定参数的线性系统上的仿真结果表明,与标准方法相比,该方法具有显著的性能增益。
阿帕
Dörschel,L.、Stenger,D.和Abel,D..(2021)。利用参数空间方法进行控制器设计的安全贝叶斯优化。第三届动力学和控制学习会议记录,英寸机器学习研究进展144:299-311可从https://proceedings.mlr.press/v144/dorschel21a.html。

相关材料