×

在最优控制中评估梯度:连续伴随与自动微分。 (英语) Zbl 1130.49308号

概述:本文讨论常微分方程最优控制问题的数值解。这里考虑的方法依赖于一些标准优化代码来解决所考虑的控制问题的离散版本。我们的目标是使优化软件不仅可以使用离散目标函数,还可以使用其梯度。目标梯度可以根据正向(灵敏度)信息或反向(伴随)信息计算。本文的目的是讨论伴随计算的各种方法。理论和数值计算都表明,基于连续伴随方程的方法需要仔细选择积分器和梯度组合公式,以获得与离散控制问题一致的梯度。特别注意自动微分技术,该技术自动生成合适的积分器。

MSC公司:

49平方米25 最优控制中的离散逼近
49甲15 常微分方程最优控制问题的存在性理论
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Pesch,H.J.,《航空航天领域最佳弹道的离线和在线计算》,航空航天科学与工程数学,A.Miele和A.Salvetti编辑,Plenum出版社,纽约州纽约市,第165-220页,1994年·Zbl 0852.70015号
[2] Bulirsch,R.、Nerz,E.、Pesch,H.J.和Von Stryk,O.,《非线性最优控制中直接和间接方法的结合:悬挂滑翔机的最大范围、最优控制、变分法、最优控制理论和数值方法》,R.Bulirsh,a.Miele,J.Stoer和K.H.Well,Birkhäuser编辑,瑞士巴塞尔,第273-288页,1993年·Zbl 0808.65067号
[3] Hiltmann,P.,Numerische Lösung von Mehrpunkt-Randwertproblemen und Aufgaben der optimizen Steuerung mit Steuerfunktionenüber endlichdimensionalen Räumen,德国慕尼黑慕尼黑大学数学研究所论文,1989年。
[4] Oberle,H.和Grimm,W.,BNDSCO–最优控制问题数值求解程序,报告515,飞行系统动力学研究所,Oberpfafenhofen,德国航空航天研究所DLR,1989年。
[5] Von Stryk,O.,《DIRCOL用户指南(2.1版):最优控制问题数值解的直接配置方法》,Fachgebiet Simulation und Systemoptimierung(SIM),达姆施塔特科技大学,2000年。
[6] Betts,J.T.,《使用非线性规划进行最优控制的实用方法》,SIAM,费城,宾夕法尼亚州,2001年·Zbl 0995.49017号
[7] Büskens,C.和Maurer,H.,《解决具有控制和状态约束的最优控制问题的SQP方法:伴随变量、灵敏度分析和实时控制》,《计算与应用数学杂志》,第120卷,第85–108页,2000年·Zbl 0963.65070号 ·doi:10.1016/S0377-0427(00)00305-8
[8] Bock,H.G.和Plitt,K.J.,直接求解最优控制问题的多重射击算法,第九届国际电子消费品联合会世界大会论文集,佩加姆出版社,匈牙利布达佩斯,1984年。
[9] Griesse,R.和Walther,A.,使用自动微分的最优控制问题的参数敏感性,最优控制应用和方法,第24卷,第297–3142003页·Zbl 1073.93518号 ·doi:10.1002/oca.733
[10] Bryson,A.E.和Ho,Y.,《应用最优控制:优化、估计和控制》,半球出版公司,纽约州纽约市,1975年。
[11] Eberhard,P.和Bischof,C.,《数值积分算法的自动微分》,《计算数学》,第68卷,第717-731页,1999年·Zbl 1017.65062号 ·doi:10.1090/S025-5718-99-01027-3
[12] Hager,W.,最优控制和变换伴随系统中的Runge-Kutta方法,《数值数学》,第87卷,第247-282页,2000年·Zbl 0991.49020号 ·doi:10.1007/s002110000178
[13] Griewank,A.,《评估导数:算法微分的原理和技术》,应用数学前沿,SIAM,宾夕法尼亚州费城,第19卷,2000年·Zbl 0958.65028号
[14] Griewank,A.,《自动微分,数学编程:最新发展和应用》,M.Iri和K.Tanabe编辑,Kluwer学术出版社,荷兰多德雷赫特,第83–107页,1989年。
[15] Griewank,A.和Walther,A.,《旋转:计算微分的反向或伴随模式的检查点实现》,《ACM数学软件汇刊》,第26卷,第19-45页,2000年·兹比尔1137.65330 ·doi:10.1145/347837.347846
[16] Rostaing,N.、Dalmas,S.和Galligo,A.,《ODYSSEE中的自动微分,计算微分:技术、应用和工具》,M.Berz、C.Bischof、G.Corliss和A.Griewank编辑,SIAM,宾夕法尼亚州费城,第558–568页,1996年。
[17] Gill,P.、Murray,W.、Saunders,M.和Wright,H.,《NPSOL 5.0用户指南:非线性编程的Fortran包》,技术报告NA 98–2,加利福尼亚大学数学系,加利福尼亚州圣地亚哥,1998年。
[18] Büskens,C.,Optimierungsmethoden und Sensivititätsanalysis für optimize Steuerprozesse mit Steuer-und Zustandsbeschräkungen,论文,威斯特法·利舍·威廉姆斯大学,1998年。
[19] Tun,T.和Dillon,T.S.,微分动态规划方法的扩展,包括具有状态相关控制约束和状态变量不等式约束的系统,应用科学与工程杂志,第3A卷,第171-192页,1978年。
[20] Jacobson,D.H.和Mayne,D.Q.,微分动态规划,美国爱思唯尔出版公司,纽约,1970年·Zbl 0223.49022号
[21] Carter,R.,《利用不精确函数和梯度信息进行非线性优化的一类算法的数值经验》,SIAM科学计算杂志,第14卷,第368-388页,1993年·Zbl 0772.65042号 ·doi:10.1137/0914023
[22] Gertz,M.、Gill,P.和Muetherig,J.,《SNADIOPT用户指南:向SNOPT添加自动微分的软件包》,技术报告NA 01–01,加利福尼亚大学数学系,加利福尼亚州圣地亚哥,2001年。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。