文件Zbl 1478.49034-zbMATH Open

通过场景方法实现稳定而稳健的LQR设计。（英语） Zbl 1478.49034号

Automatica公司 129，文章ID 109571，第7页（2021）.

摘要：线性二次调节器（LQR）设计是最经典的最优控制问题之一，其著名的解决方案是以状态反馈表示的输入序列。本文在稳定性约束和不确定系统动力学条件下求解了有限时域和离散时间LQR。由此产生的反馈控制器平衡了成本值和闭环稳定性。解决方案的鲁棒性使用场景方法建模，不需要对系统矩阵中的不确定性进行任何概率描述。新方法在Leslie增长模型上进行了测试和比较，在该模型中，我们控制了种群规模，同时最小化了合适的有限时域成本函数。

引用于1文件

MSC公司：

49甲10	线性二次型最优控制问题
49号35	最优反馈综合
92D25型	人口动态（一般）

关键词：

最优控制;强化学习;李亚普诺夫稳定性;情景方法;人口增长模型;线性二次调节器（LQR）设计

软件：

RICPAC公司;ElemStatLearn（电子状态学习）

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

参考文献：

[1]	阿拉莫，T。；节奏，R。；Camacho，E.，不确定可行性和优化问题概率解的随机策略，IEEE自动控制汇刊，542545-2559（2009）·Zbl 1367.90106号
[2]	安德森，B.D.O。；Moore，J.B.，《最优控制：线性二次型方法》（1990），普伦蒂斯·霍尔公司：普伦蒂斯霍尔公司，美国新泽西州上鞍河·兹比尔0751.49013
[3]	Arnold，W.F。；Laub，A.J.，代数riccati方程的广义特征问题算法和软件，IEEE学报，72，12，1746-1754（1984）
[4]	贝尔，B.M。；Burke，J.，隐函数和最优值的算法微分，计算科学与工程讲义，64，67-77（2008）·Zbl 1152.65434号
[5]	贝尔，B。；Pillonetto，G.，使用非线性测量模型估计一个变量的参数和随机函数，反问题，20，3，627（2004）·Zbl 1055.62028号
[6]	Bellman，R.E.，《动态编程》（2003），多佛出版公司：美国纽约州多佛出版公司·Zbl 1029.90076号
[7]	Bempoad，A.，具有输入/状态约束的线性系统的带有人工Lyapunov函数的预测控制器，Automatica，34，10，1255-1260（1998）·Zbl 0938.93524号
[8]	Bemporad，A。；Morari，M.，《鲁棒模型预测控制：一项调查》（Garulli，A.；Tesi，A.，《识别和控制中的鲁棒性》（1999），施普林格伦敦：施普林格英国伦敦），207-226·Zbl 0979.93518号
[9]	Bertsekas，D.P.，《动态规划和最优控制》（2000），雅典娜科学出版社
[10]	Bertsekas，D.P.，稳定最优控制和半牵引动态规划，SIAM控制与优化杂志，56，1，231-252（2018）·Zbl 1386.49040号
[11]	比特米德，R。；Gevers，M.，Riccati差分和微分方程：收敛性、单调性和稳定性，（Bittanti，S.；Laub，A.；Willems，J.，The Riccati方程（1991））·Zbl 0734.34004号
[12]	博伊德，S。；El Ghaoui，L。；Feron，E。；Balakrishnan，V.，（系统和控制理论中的线性矩阵不等式。系统和控制论中的线性阵不等式，应用数学研究，第15卷（1994年），SIAM:SIAM Philadelphia，PA）·Zbl 0816.93004号
[13]	博伊德，S。；Vandenberghe，L.，《凸优化》（2004），剑桥大学出版社：剑桥大学出版社，美国纽约州纽约市·兹比尔1058.90049
[14]	Bressan，A。；Piccoli，B.，《控制数学理论导论》（2007），应用数学AIMS。美国数学科学研究所·Zbl 1127.93002号
[15]	Bryson，A.E。；Ho，Y.，《应用最优控制：优化、估计和控制》，481（1975），半球出版公司；由Halsted Press Washington:Hemisphere Publishing Corporation发行；由Halsted Press Washington New York发行
[16]	Calafiore，G.C.，随机凸规划，SIAM优化杂志，20，3427-3464（2010）·Zbl 1211.90168号
[17]	Calafiore，G.C。；Campi，M.C.，鲁棒控制设计的情景方法，IEEE自动控制汇刊，51，5，742-753（2006）·Zbl 1366.93457号
[18]	Calafiore，G.C。；El Ghaoui，L.（优化模型.优化模型，控制系统和优化系列（2014），剑桥大学出版社）·Zbl 1342.90001号
[19]	Calafiore，G.C。；Fagiano，L.，通过场景优化实现鲁棒模型预测控制，IEEE自动控制汇刊，58219-224（2013）·兹比尔1369.93333
[20]	坎皮，M.C。；Garatti，S.，《情景方法简介》（2018年），美国工业与应用数学学会：美国宾夕法尼亚州费城工业和应用数学学会·Zbl 1426.90151号
[21]	坎皮，M.C。；加拉蒂，S。；Ramponi，F.，非凸优化和决策的一般场景理论，IEEE自动控制汇刊，63，12，4067-4078（2018）·Zbl 1423.90196号
[22]	De Nicolao，G。；马格尼，L。；Scattolini，R.，非线性滚动时域控制的稳定性和鲁棒性，（Allgöwer，F.；Zheng，A.，非线性模型预测控制（2000），Birkhäuser Basel:Birkháuser巴塞尔），3-22·Zbl 0958.93512号
[23]	de Oliveira，M.C。；伯努苏，J。；Geromel，J.C.，一种新的离散时间鲁棒稳定性条件，《系统与控制快报》，37，4，261-265（1999）·Zbl 0948.93058号
[24]	杜，D.Z。；Pardalos，P.M.，（Minimax和应用。Minimax与应用，非凸优化及其应用（1995），Springer US）·Zbl 0832.00015号
[25]	Finsler，P.，在《scharen quadratischer formen》（1937年）中，将vorkommen定义者和半定义者定义为
[26]	Gelfand，I.M。；Fomin，S.V.公司。；Silverman，R.A.，（变分法。变分法，多佛数学书籍（2000年），多佛出版物）·Zbl 0964.49001号
[27]	古德费罗，我。；Y.本吉奥。；A.Courville，《深度学习》（2016），麻省理工学院出版社·Zbl 1373.68009号
[28]	语法，S。；张，X。；马盖洛斯，K。；Goulart，P。；Lygeros，J.，非凸控制设计的情景方法，IEEE自动控制汇刊，61（2016）·Zbl 1359.93448号
[29]	Grüne，L.，《无终端约束的NMPC》，IFAC会议论文集，45，17，1-13（2012），第四届IFAC非线性模型预测控制会议
[30]	Grüne，L。；Pannek，J.，非线性模型预测控制，（非线性模型预测控制（2017），施普林格），45-69·Zbl 1429.93003号
[31]	哈斯蒂·T·J。；Tibshirani，R.J。；弗里德曼，J.，《统计学习的要素》。数据挖掘、推理和预测（2001），Springer:Springer Canada·Zbl 0973.62007号
[32]	Helly，E.，U ber Mengen konvexer Körper mit gemeinschaftlichen Punkte，德国数学研究所，32，175-176（1923）
[33]	Hou，C.，《参数不确定性下的动态规划及其在网络安全和项目管理中的应用》（2015），俄亥俄州立大学（博士论文）
[34]	Jain，P。；Kar，P.，机器学习的非凸优化，机器学习基础与趋势，10，3-4，142-363（2017）·Zbl 1388.68251号
[35]	Kalman，R.，《对最优控制理论的贡献》，Boletin de la Sociedad Matematica，5（1960）·Zbl 0112.06303号
[36]	Keerthi，S.S。；Gilbert，E.G.，一般约束离散时间系统的最优无穷大反馈律：稳定性和移动时域近似，优化理论与应用杂志，57，265-293（1988）·Zbl 0622.93044号
[37]	Kleinman，D.，稳定线性常数系统的简单方法，IEEE自动控制汇刊，15，6，692（1970）
[38]	库恩，H.W。；Tucker，A.W.，《非线性规划》（第二届伯克利数理统计与概率研讨会论文集（1951年），加利福尼亚大学出版社：加利福尼亚大学伯克利分校），481-492·Zbl 0044.05903号
[39]	Kwakernaak，H.公司。；Sivan，R.，线性最优控制系统（1972），Wiley Interscience，纽约·Zbl 0276.93001号
[40]	Kwon，W。；Pearson，A.，关于时变离散线性系统的反馈镇定，IEEE自动控制汇刊，23，3，479-481（1978）·Zbl 0378.93038号
[41]	拉萨尔，G。；Lefschetz，S.，（利亚普诺夫直接法应用的稳定性。利亚普洛夫直接法的应用稳定性，科学与工程数学，第4卷（1961年），爱思唯尔），iii·Zbl 0098.06102号
[42]	兰卡斯特，P。；罗德曼，L.（代数Riccati方程。代数Riccaty方程，牛津科学出版物（1995），克拉伦登出版社）·Zbl 0836.15005号
[43]	Leslie，P.H.，《关于矩阵在某些人口数学中的应用》，《生物计量学》，第33、3、183-212页（1945年）·Zbl 0060.31803号
[44]	Lewis，F.L.，（最优控制。最优控制，一份狡猾的科学出版物（1986），wiley）·Zbl 0665.93065号
[45]	Luenberger，D.G.，《动力系统导论：理论、模型和应用》（1979），威利出版社·Zbl 0458.93001号
[46]	Luenberger，D.G.，向量空间方法优化（1997），John Wiley&Sons，Inc.：John Willey&Sons公司，美国纽约州纽约市
[47]	马尔滕森，K。；Rantzer，A.，《大系统结构化控制器的合成》（2019年）
[48]	D.Q.梅恩。；罗林斯，J.B。；Rao，C.V。；Scokaert，P.O.M.，约束模型预测控制：稳定性和最优性，Automatica，36789-814（2000）·Zbl 0949.93003号
[49]	Nocedal，J。；Wright，S.J.，数值优化（2006），Springer:Springer New York，NY，USA·Zbl 1104.65059号
[50]	Pontryagin，L.S.（最优化过程的数学理论。最优化过程的数理理论，苏联数学经典（1987），Taylor&Francis）·Zbl 0616.49001号
[51]	雷蒙多，D.M。；利蒙，D。；拉扎尔，M。；Magni，L。；Fernández Camacho，E.，非线性系统的Min-max模型预测控制：稳定性的统一概述，欧洲控制杂志，15，1，5-21（2009）·Zbl 1298.93291号
[52]	Raković，S.V。；S.Levine，W.，《模型预测控制手册》（2018），Birkhäuser Basel
[53]	罗林斯，J.B。；Muske，K.R.，约束滚动时域控制的稳定性，IEEE自动控制汇刊，38，10，1512-1516（1993）·Zbl 0790.93019号
[54]	Recht，B.，《强化学习之旅：来自持续控制的观点》，《控制、机器人和自治系统年度回顾》，第2期，第1期，第253-279页（2019年）
[55]	Saltik，M.B。；奥兹坎，L。；Ludlage，J.H.A。；Weiland，S。；Van den Hof，P.M.J.，《鲁棒模型预测控制算法展望：性能和计算方面的思考》，《过程控制杂志》，61，77-102（2018）
[56]	Scampicchio，A。；Aravkin，A。；Pillonetto，G.，稳定性约束下的LQR设计，（第21届国际会计师联合会世界大会（2020年）会议记录），出版中。预打印可在http://www.optimization-online.org/DB_HTML/200/07/7927.HTML
[57]	Scokaert，P.O.M。；Mayne，D.Q.，约束线性系统的Min-max反馈模型预测控制，IEEE自动控制汇刊，43，8，1136-1142（1998）·Zbl 0957.93034号
[58]	Thomas，Y.A.，具有滚动时域的线性二次最优估计和控制，《电子快报》，11，1，19-21（1975）
[59]	Tseng，P.，分裂算法在凸规划和变分不等式分解中的应用，SIAM控制与优化杂志，29，1，119-138（1991）·兹比尔0737.90048
[60]	Tseng，P.，不可微极小化的块坐标下降法的收敛性，优化理论与应用杂志，109，3，475-494（2001）·Zbl 1006.65062号
[61]	Vapnik，V.N.，《统计学习理论》（1998），Wiley-Interscience·Zbl 0935.62007号
[62]	Yang，T.H。；Polak，E.，具有输入饱和、扰动和对象不确定性的非线性系统的移动时域控制，国际控制杂志，58，4，875-903（1993）·Zbl 0786.93046号

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

通过场景方法实现稳定而稳健的LQR设计。（英语） Zbl 1478.49034号

MSC公司：

关键词：

软件：

参考文献：

示例

领域

操作员

通过场景方法实现稳定而稳健的LQR设计。 （英语） Zbl 1478.49034号

MSC公司：

关键词：

软件：

参考文献：

通过场景方法实现稳定而稳健的LQR设计。（英语） Zbl 1478.49034号