×

基于极值搜索的未知离散线性系统的有限维LQ控制。 (英语) Zbl 1293.49080号

摘要:我们提出了一种基于非模型的方法,用于具有标量输入的未知离散线性系统的最优开环控制序列的渐近、局部指数稳定实现,其中系统的维数甚至都未知。该控制序列最小化了有限时间范围内的成本函数,该函数在测量输出和输入中是二次的。我们不假设未知系统的稳定性,但我们假设系统是可到达的。该算法采用多变量离散时间极值搜索方法最小化代价函数,扩展了标量离散时间极点搜索方法的结果。仿真结果表明,用于衡量优化问题难度的Hessian条件数随着系统的不稳定性水平和标量系统的有限时域长度的增加而增加。因此,如果可能的话,我们建议解决条件良好的、较短时间范围的最优控制问题,以获得较长时间范围问题的良好初始控制估计。我们还证明了该算法通过使用投影算子来适应输入约束,并引入了一个基于Newton的离散时间极值搜索控制器,消除了收敛速度对未知Hessian的依赖性。

MSC公司:

49纳米10 线性二次型最优控制问题
93C55美元 离散时间控制/观测系统
93二氧化碳 控制理论中的线性系统
49英里15 牛顿型方法
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 阿里尤尔,K.B。;Kristic,M.,《通过极值搜索控制实现实时优化》(2003),Wiley-Interscience:Wiley-Interscience-Hoboken,NJ·Zbl 1031.93002号
[2] Bai,E.-W。;Fu,L.-C。;Sastry,S.S.,离散时间和采样数据自适应系统的平均分析,IEEE电路与系统汇刊,35,2,137-148(1988)·Zbl 0649.93036号
[3] Bhatia,R.,矩阵分析(1996),Springer:Springer New York,NY·Zbl 0863.15001号
[4] 博伊德,S。;Vandenberghe,L.,《凸优化》(2004),剑桥大学出版社:剑桥大学出版社,纽约·兹比尔1058.90049
[5] Carnevale,D。;Astolfi,A。;Centioli,C。;波达,S。;维塔莱,V。;Zaccarian,L.,一种新的极值搜索技术及其在FTU上最大化射频加热的应用,Fusing Engineering and Design,84,554-558(2009)
[6] 陈,Y。;Wen,C.,迭代学习控制收敛、鲁棒性和应用(1999),Springer:Springer纽约,纽约·Zbl 0949.93002号
[7] Choi,J.-Y。;Krstic,M。;Ariyur,K.B。;Lee,J.S.,离散时间系统的极值寻求控制,IEEE自动控制汇刊,47318-323(2002)·Zbl 1364.93429号
[8] 科克伦,J。;Kanso,E。;Kelly,S.D。;熊,H。;Krstic,M.,鱼类运动的两个非完整模型的源搜索,IEEE机器人学报,25,5,1166-1176(2009)
[9] 科克伦,J。;Krstic,M.,《角速度调谐的非完整寻源》,《自动控制学报》,54,4,717-731(2009)·兹比尔1367.70015
[10] 科尔曼,T.F。;Li,Y.,用于最小化受某些变量边界约束的二次函数的反射牛顿法,SIAM优化杂志,6,4,1040-1058(1996)·Zbl 0861.65053号
[11] Dierks,T。;图马蒂,B.T。;Jagannathan,S.,使用带收敛证明的离线训练神经网络对未知仿射非线性离散时间系统进行最优控制,神经网络,22851-860(2009)·Zbl 1338.49074号
[13] 弗里豪夫,P。;Krstic,M。;巴沙尔,T.,非合作博弈中的纳什均衡寻求,IEEE自动控制交易,57,5,1192-1207(2012)·Zbl 1369.91010号
[14] Fulton,W.,特征值、不变因子、最高权重和舒伯特微积分,美国数学学会公报,37,3209-249(2000)·Zbl 0994.15021号
[15] Ghaffari,A。;Krstic,M。;Nešić,D.,多变量基于牛顿的极值搜索,Automatica,48,8,1759-1767(2012)·Zbl 1269.49047号
[16] 新泽西州Killingsworth。;Aceves,S.M。;Flowers,D.L。;Espinosa-Loza,F。;Krstic,M.,HCCI发动机燃烧时间控制通过极值搜索优化增益和油耗,IEEE控制系统技术汇刊,17,6,1350-1361(2009)
[18] 刘易斯,F.L。;Vamvoudakis,G.,《部分可观测动态过程的强化学习使用测量输出数据的自适应动态规划》,IEEE Transactions System Man和《控制论》,B部分,41,1,14-25(2011)
[20] Moore,K.L.,确定性系统的迭代学习控制(1993),Springer-Verlag:Springer-Verlag纽约,NY·Zbl 0773.93002号
[22] 欧,Y。;徐,C。;舒斯特,E。;卢斯,T.C。;Ferron,J.R。;Walker,M.L。;Humphreys,D.A.,DIII-D托卡马克电流分布极值寻求开环最优控制的设计与仿真,等离子体物理与受控聚变,50,11,1-24(2008)
[23] Rugh,W.J.,线性系统理论(1996),普伦蒂斯·霍尔·兹比尔0892.93002
[24] Stanković,M.S。;Johansson,K.H。;Stipanović,D.M.,移动传感器网络应用中Nash均衡的分布式搜索,IEEE自动控制汇刊,57,4,904-919(2012)·Zbl 1369.91031号
[25] Stanković,M.S。;Stipanović,D.M.,随机噪声下的极值搜索及其在移动传感器中的应用,Automatica,46,1243-1251(2010)·Zbl 1204.93111号
[26] Tan,Y。;内西奇,D。;Mareels,I.,关于极值寻求控制的非局部稳定性,Automatica,42,6889-903(2006)·Zbl 1117.93362号
[27] 王,D。;刘,D。;魏,Q。;赵,D。;Jin,N.,基于自适应动态规划的未知非仿射非线性离散时间系统的最优控制,Automatica,48,8,1825-1832(2012)·Zbl 1269.49042号
[28] 王,H.-H。;杨,S。;Krstic,M.,极值搜索在轴流压缩机上的实验应用,IEEE控制系统技术汇刊,8,300-309(2000)
[29] 王,H.-H。;Krstic,M.,极限循环最小化的极值寻求,IEEE自动控制汇刊,452432-2437(2000)·Zbl 0989.93059号
[30] 徐,J.-X。;Tan,Y.,线性和非线性迭代学习控制(2003),Springer-Verlag·兹比尔1021.93002
[31] 杨琼。;Jagannathan,S.,使用在线逼近器的仿射非线性离散时间系统的强化学习控制器设计,IEEE Transactions System Man和Control netics,B部分,42,2,377-390(2012)
[32] 张,C。;阿诺德博士。;北卡罗来纳州戈兹。;Siranosian,A。;Krstic,M.,《无位置测量和前向速度调谐的非完整单周期寻源》,《系统与控制快报》,56,245-252(2007)·Zbl 1114.93070号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。