×

基于近似动态规划的多进程多传感器遥感传输调度。 (英语) Zbl 1485.93629号

作者考虑了多传感器多进程传输调度问题,其中一组N个传感器可以通过一个有噪声的无线网络同时与估计器通信。目的是最小化传感器间误差协方差轨迹的期望和。作者利用相关的随机动态规划框架将所考虑的问题表示为一个时间齐次马尔可夫决策过程。假设每个传感器都配备有局部卡尔曼滤波器,并且远程估计器可以在接收到的信号干扰和噪声比高于特定阈值时对多个传感器传输进行解码。针对模型逼近目标函数的问题,提出了改进的贪婪最小二乘时间差分算法。证明了该算法在误差估计下的收敛性。通过数值算例验证了算法的有效性。

MSC公司:

93E20型 最优随机控制
93E11号机组 随机控制理论中的滤波
90立方厘米 马尔可夫和半马尔可夫决策过程
93立方厘米05 控制理论中的线性系统
49升20 最优控制与微分对策中的动态规划
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Bertsekas,D.P.,一般投影方程的时间差分方法,IEEE自动控制汇刊,56,9,2128-2139(2011)·Zbl 1368.90155号
[2] Bertsekas,D.P.,《动态规划和最优控制》,第二卷,(2012),雅典娜科学:雅典娜科技MA,美国马萨诸塞州贝尔蒙特·Zbl 1298.90001号
[3] Bertsekas,D.P。;Yu,H.,大型线性系统近似解的投影方程法,计算与应用数学杂志,227,27-50(2009)·Zbl 1165.65010号
[4] Busoniu,L。;Ernst,D。;德舒特,B。;Babuska,R.,具有自适应基函数的控制策略的交叉优化,IEEE系统、人和控制论事务-第B部分:控制论,41,1,196-209(2011)
[5] De Farias,D.P。;Van Roy,B.,《近似动态规划的线性规划方法》,运筹学,51,6,850-865(2003)·兹比尔1165.90666
[6] 邓,K。;陈,Y。;Belta,C.,具有时间逻辑约束的随机环境中多智能体持续监测的近似动态规划方法,IEEE自动控制汇刊,62,94549-4563(2017)·Zbl 1390.93867号
[7] Forootani,A。;勒沃利诺,R。;Tipaldi,M.,《将未加权最小二乘技术应用于随机动态规划:理论与应用》,IET控制理论与应用,13,152387-2398(2019)
[8] Forootani,A。;勒沃利诺,R。;蒂帕尔迪,M。;Neilson,J.,随机资源分配问题的近似动态规划,IEEE/CAA自动化杂志,7,4,975-990(2020)
[9] Forootani,A。;Liuzza,D。;蒂帕尔迪,M。;Glielmo,L.,《通过价格管理系统分配资源:基于动态规划的方法》,《国际控制杂志》(2019年)
[10] Forootani,A。;蒂帕尔迪,M。;Ghanie Zarch,M。;Liuzza,D。;Glielmo,L.,解决资源分配问题的基于最小二乘时间差分的方法,IFAC系统与控制杂志,13,1-15(2020)
[11] Forootani,A。;蒂帕尔迪,M。;Ghanie Zarch,M。;Liuzza,D。;Glielmo,L.,通过动态规划方法建模和解决资源分配问题,国际控制杂志,94,6,1544-1555(2020)·Zbl 1471.91197号
[12] Forootani,A。;蒂帕尔迪,M。;勒沃利诺,R。;Dey,S.,最优停止问题的增强探索最小二乘法,IEEE控制系统信函,6271-276(2022)
[13] Gatsis,K。;里贝罗,A。;Pappas,G.J.,《无线控制系统的随机接入设计》,Automatica,91,1-9(2018)·Zbl 1387.93142号
[14] 盖斯特,M。;Pietquin,O.,参数值函数近似算法调查,IEEE神经网络和学习系统汇刊,24,6,845-867(2013)
[15] 古普塔,V。;Chung,T.H。;哈西比,B。;Murray,R.M.,《随机传感器选择算法及其在传感器调度和传感器覆盖中的应用》,Automatica,42,2,251-260(2006)·兹比尔1125.93486
[16] 古普塔,V。;Hassibi,B。;Murray,R.M.,《跨数据包丢弃链路的最优LQG控制》,《系统与控制快报》,56,6,439-446(2007)·Zbl 1137.90379号
[17] Han,D。;吴杰。;张,H。;Shi,L.,多线性动力系统的最优传感器调度,Automatica,75,260-270(2017)·Zbl 1352.93101号
[18] Hoffman,M.W.,Lazaric,A.,Ghavamzadeh,M.,&Munos,R.带嵌套(l_2)和(l_1)惩罚的正则化最小二乘时间差分学习。欧洲强化学习研讨会(第102-114页)。
[19] Leong,A.S。;戴伊·S。;Quevedo,D.E.,带数据包丢失的基于方差的事件触发估计中的传感器调度,IEEE自动控制事务,62,4,1880-1895(2017)·Zbl 1366.90108号
[20] 梁振英。;Quevedo,D.E。;田中,T。;戴伊·S。;Ahlen,A.,基于事件的传输调度和分组丢弃链路上的LQG控制,IFAC-PapersOnLine,50,1,8945-8950(2017)
[21] Leong,A.S。;Ramaswamy,A。;Quevedo,D.E。;卡尔·H。;Shi,L.,《网络物理系统中无线传感器调度的深度强化学习》,Automatica,113,第108759页,(2020)·Zbl 1440.93155号
[22] 李,Y。;Chen,C.S。;Wong,W.S.,干扰信道上多传感器远程状态估计的功率控制,《系统与控制快报》,126(2019)·Zbl 1425.93196号
[23] 刘伟。;Quevedo,D.E。;Johansson,K.H。;Vucetic,B。;Li,Y.,多马尔可夫衰落信道上多系统的远程状态估计(2021),arXiv预印本arXiv:2104.04181
[24] Nedic,A。;Bertsekas,D.P.,线性函数近似的最小二乘政策评估算法,离散事件动态系统,13,79-110(2003)·Zbl 1030.93061号
[25] 努里安,M。;Leong,A.S。;Dey,S.,《在不完全确认和能量收集约束的数据包丢弃链路上卡尔曼滤波的最佳能量分配》,IEEE自动控制事务,59,8,2128-2143(2014)·Zbl 1360.93707号
[26] 帕潘德里奥普洛斯,J。;Evans,J.S。;Dey,S.,带中断约束的Rayleigh-faded多用户系统的最优功率控制,IEEE无线通信汇刊,4,6,2705-2715(2005)
[27] Perez-Neira,A.I。;Campalans,M.R.,《无线通信中的跨层资源分配:物理层和MAC层交互的技术和模型》(2010),学术出版社
[28] Pezzutto,M.、Schenato,L.和Dey,S.(2020)。多传感器干扰下多数据包接收远程估计的传输调度。国际会计师联合会世界大会第21届会议记录。
[29] 佩佐托,M。;Schenato,L。;Dey,S.,具有多包接收能力的远程估计传输功率分配(2021),arXiv预打印arXiv:2101.12493
[30] 佩佐托,M。;Schenato,L。;Dey,S.,具有多包接收能力的远程估计传输功率分配(2021),arXiv预打印arXiv:2101.12493
[31] 任,X。;吴杰。;戴伊·S。;Shi,L.,多系统远程状态估计的攻击分配:结构结果和渐近解,Automatica,87(2018)·Zbl 1378.93122号
[32] 任,X。;吴杰。;Johansson,K.H。;Shi,G。;Shi,L.,衰落信道下用于远程状态估计的无限时域最优传输功率控制,IEEE自动控制汇刊,63,1,85-100(2018)·Zbl 1390.93803号
[33] Schenato,L.,《随机延迟和数据包丢失下网络控制系统的最优估计》,IEEE自动控制事务,53,5,1311-1317(2008)·Zbl 1367.93633号
[34] Schenato,L。;Sinopoli,B。;Franceschetti,M。;Poolla,K。;Sastry,S.S.,《有损网络的控制和估计基础》,IEEE学报,95,1163-187(2007)
[35] Shi,L。;Cheng,P。;Chen,J.,有限资源下的最优周期传感器调度,IEEE自动控制汇刊,56,9,2190-2195(2011)·Zbl 1368.90083号
[36] Shi,L。;Cheng,P。;Chen,J.,通信能量约束下最优状态估计的传感器数据调度,Automatica,47,8,1693-1698(2011)·Zbl 1226.93126号
[37] 齐齐克利斯,J.N。;Van Roy,B.,用函数逼近分析时间差分学习,IEEE自动控制汇刊,42,5(1997)·Zbl 0914.93075号
[38] 王,M。;Polydorides,N。;Bertsekas,D.P.,基于近似模拟的大规模最小二乘问题解决方案实验室。信息和决策系统报告LIDS-P-2819(2009),麻省理工学院
[39] 吴杰。;贾,Q.S。;约翰逊,K.H。;Shi,L.,《基于事件的传感器数据调度:通信速率和估计质量之间的权衡》,IEEE自动控制汇刊,26,4(2013)·Zbl 1369.90086号
[40] Wu,S。;任,X。;戴伊·S。;Shi,L.,带数据包传输约束的共享信道上多传感器的最优调度,Automatica,96,22-31(2018)·Zbl 1406.93336号
[41] Xu,Y.和Hespanha,J.P.(2005)。网络控制系统中不受控和受控通信下的估计。第44届IEEE决策与控制会议记录(第842-847页)。
[42] Zanella,A。;Zorzi,M.,具有多分组接收能力的无线系统中捕获概率的理论分析,IEEE通信汇刊,60,41058-1071(2012)
[43] 赵,L。;张伟。;胡,J。;阿巴特,A。;Tomlin,C.J.,关于无限大线性传感器调度问题的最优解,IEEE自动控制汇刊,59,10,825-2830(2014)·Zbl 1360.90136号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。