×

对偶最优控制和基于信息的最优控制等价的示例。 (英语) Zbl 1423.93410号

摘要:信息化控制针对一类具有二次成本和未知常参数的对偶控制问题,建立了IBC模型。通过动态规划解决了简单的双重控制问题。然后,将溶液与IBC获得的溶液进行比较。研究表明,适当选择学习强度可以恢复至少一类非平凡对偶控制问题的最优对偶控制。

MSC公司:

93E20型 最优随机控制
90立方厘米 动态编程
49甲15 对偶理论(优化)
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] Alpcan,T。;Shames,I.,双重控制的信息化学习方法,IEEE神经网络和学习系统事务,, 26, 11, 2736-2748 (2015)
[2] Alpcan,T。;羞耻,I。;坎通尼,M。;Nair,G.,双重控制的学习和信息,1-6(2013),IEEE
[3] 奥斯特罗姆,K。;Wittenmark,B.,自适应控制(2008),纽约州米诺拉市:多佛出版物,纽约州米诺拉市·Zbl 1163.93020号
[4] Banek,T.,离散时间部分观测随机系统的信息增量值,控制与控制论,, 39, 3, 769-781 (2010) ·Zbl 1280.93081号
[5] Banek,T。;Kozlowski,E.,系统熵的自适应控制,控制与控制论,, 35, 2, 279-289 (2006) ·Zbl 1176.93038号
[6] Bania,P.,具有几乎解析解的双重控制问题的简单示例,先进智能控制、优化和自动化趋势。程序。KKA 2017第19届波兰控制会议,,55-64(20171821),施普林格
[7] 巴尼亚,P。;Baranowski,J.,Field Kalman滤波器及其近似,2875-2880(20161214)·Zbl 1042.65523号
[8] 巴尼亚,P。;Baranowski,J.,故障状态的贝叶斯估计:对数优势法,253-257(20172831)
[9] Baranowski,J。;巴尼亚,P。;I·普拉萨德。;Cong,T.,使用Field Kalman滤波器进行贝叶斯故障检测和隔离,EURASIP信号处理进展杂志,, 79 (2017) ·doi:10.1186/s13634-017-0514-8
[10] Bar-Shalom,Y.,《随机动态规划:谨慎与探索》,IEEE自动控制汇刊,, 26, 5, 1184-1195 (1981) ·Zbl 0472.93071号
[11] Bar-Shalom,Y。;Tse,E.,Caution,probing和信息在不确定系统控制中的价值,经济与社会计量年鉴,, 5, 323-337 (1976)
[12] Bernhardsson,B.,具有两个可能增益的一阶系统的双重控制,国际自适应控制与信号处理杂志,, 3, 15-22 (1989) ·Zbl 0733.93079号
[13] 陈,R。;Loparo,K.A.,未知参数线性随机系统的对偶控制,65-68(1991),IEEE
[14] 方,S。;陈,J。;Hideaki,I.,《走向控制与信息理论的整合》。控制与信息科学讲座笔记,465(2017年),纽约:施普林格,纽约·Zbl 1371.93001号
[15] Feldbaum,A.A.,《最优控制系统》(1965),剑桥:爱思唯尔科学出版社,剑桥·Zbl 0138.33901号
[16] 冯,X。;Loparo,K.,《随机系统的最优状态估计:信息论方法》,IEEE自动控制汇刊,, 42, 6, 771-785 (1997) ·Zbl 0879.93049号
[17] 新墨西哥州费拉托夫。;Unbehauen,H.,《自适应双重控制:理论与应用》。《控制与信息科学讲座笔记》第302期(2004年),柏林-海德堡-纽约:斯普林格-Verlag,柏林-海德堡-新约克·Zbl 1061.93002号
[18] Henderson,H.V。;Searle,S.R.,关于矩阵求和的逆,SIAM审查,, 23, 1, 53-60 (1981) ·Zbl 0451.15005号
[19] Hijab,O.,熵与双重控制,45-50(1984)
[20] Huber,M.F。;Bailey,T。;杜兰·怀特,H。;Hanebeck,U.D.,关于高斯混合随机向量的熵近似(20082022)
[21] Li,J.-S。;Khaneja,N.,线性系统的集成控制,3768-3773(2007),IEEE
[22] 李,D。;钱,F。;Fu,P.,未知参数离散线性二次高斯问题的最优标称对偶控制,Automatica公司,, 44, 119-127 (2008) ·Zbl 1138.93413号
[23] Papoulis,A.,《概率、随机变量和随机过程》(1984),纽约州纽约州纽约市:麦格劳-希尔·Zbl 0191.46704号
[24] Saridis,G.N.,最优和自适应控制的熵公式,IEEE自动控制汇刊,, 33, 8, 713-721 (1988) ·Zbl 0788.93050号
[25] Scardovi,L.,状态和参数估计的基于信息的控制(2005),热那亚大学
[26] Touchette,H。;Lloyd,S.,控制的信息论极限,物理审查信函,, 84, 6, 1156-1159 (2000)
[27] Touchette,H。;Lloyd,S.,控制系统研究的信息论方法,物理学A,, 331, 140-172 (2004)
[28] 蔡永安。;卡西略,F.A。;Loparo,K.A.,最优和自适应控制问题的离散时间熵公式,IEEE自动控制汇刊,, 37, 7, 1083-1088 (1992) ·Zbl 0788.93053号
[29] Tse,E.,自适应双重控制方法,经济和社会计量年鉴,, 3, 1, 65-83 (1974)
[30] Wittenmark,B.,自适应双重控制方法;概述,67-72(1995),国际会计师联合会
[31] Zabczyk,J.,《机会与决定》。离散时间的随机控制(1996),意大利比萨:意大利比萨Scuola Normale Superiore出版社
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。