曾雨轩;王志国;白建超;沈晓静 一种用于非凸和非光滑有限和优化的加速随机ADMM。 (英语) Zbl 07856239号 Automatica公司 163,文章ID 111554,8 p.(2024).MSC公司:93E20型 68T05年 PDF格式BibTeX公司 XML格式引用 \textit{Y.Zeng}等人,Automatica 163,文章ID 111554,8 p.(2024;Zbl 07856239) 全文: DOI程序 arXiv公司
奥马尔·卡西姆;高,渭南;瓦姆武达基斯,Kyriakos G。 基于混合迭代的连续非线性仿射系统自适应最优控制。 (英语) Zbl 1522.93095号 Automatica公司 157,文章ID 111261,10 p.(2023).MSC公司:93C40型 90立方厘米 93立方厘米 PDF格式BibTeX公司 XML格式引用 \textit{O.Qasem}等人,Automatica 157,文章ID 111261,10 p.(2023;Zbl 1522.93095) 全文: DOI程序
李宇哲;陈,冉;史,杨 基于时空学习的随机MPC及其在航空发动机控制中的应用。 (英语) Zbl 1520.93135号 Automatica公司 153,文章ID 111014,10 p.(2023).MSC公司:93B45码 93E35型 93E20型 93立方厘米 PDF格式BibTeX公司 XML格式引用 \textit{Y.Li}等人,Automatica 153,文章ID 111014,10 p.(2023;Zbl 1520.93135) 全文: DOI程序
安德烈亚斯·马利科普洛斯。 网络物理系统的学习和控制分离。 (英语) Zbl 1520.93194号 Automatica公司 151,文章ID 110912,13 p.(2023).MSC公司:93B70型 93C83号 93E20型 93E35型 90立方厘米 PDF格式BibTeX公司 XML格式引用 \textit{A.A.Malikopoulos},Automatica 151,文章ID 110912,13 p.(2023;Zbl 1520.93194) 全文: DOI程序 arXiv公司
Abbaszadeh Chekan,贾法尔;塞德里克·兰博特 数据库攻击下基于在线学习的线性二次控制的遗憾界。 (英语) Zbl 1520.93623号 Automatica公司 151,文章ID 110876,10 p.(2023).MSC公司:93E35型 93E20型 49甲10 93E24型 PDF格式BibTeX公司 XML格式引用 \textit{J.Abbaszadeh Chekan}和\textit{C.Langbort},Automatica 151,文章ID 110876,10 p.(2023;Zbl 1520.93623) 全文: DOI程序
科恩,马克斯·H。;卡林·贝尔塔 使用控制屏障功能进行基于模型的强化学习的安全探索。 (英语) Zbl 1505.93123号 Automatica公司 147,文章ID 110684,9 p.(2023).MSC公司:93C40型 68T05年 93立方厘米 49升20 PDF格式BibTeX公司 XML格式引用 \textit{M.H.Cohen}和\textit{C.Belta},Automatica 147,文章ID 110684,9 p.(2023;Zbl 1505.93123) 全文: DOI程序 arXiv公司
陈慈;谢丽华;谢、坎;Lewis,Frank L。;谢胜利 基于输出反馈强化学习的连续时间系统自适应最优输出跟踪。 (英语) 兹比尔1504.93197 Automatica公司 146,文章ID 110581,14 p.(2022).MSC公司:93C40型 93B52号 49甲15 PDF格式BibTeX公司 XML格式引用 \textit{C.Chen}等人,Automatica 146,文章ID 110581,14 p.(2022;Zbl 1504.93197) 全文: DOI程序
谢克迪;于、肖;Lan,威耀 基于内模和自适应动态规划的未知连续线性系统最优输出调节。 (英语) Zbl 1504.93206号 Automatica公司 146,文章ID 110564,第7页(2022).MSC公司:93C40型 93二氧化碳 90立方厘米 PDF格式BibTeX公司 XML格式引用 \textit{K.Xie}等人,Automatica 146,文章ID 110564,第7页(2022;Zbl 1504.93206) 全文: DOI程序
谢思玉;马苏德·纳扎里。;王乐毅;乔治·尹 具有观测噪声和未知随机目标变化的分布式优化中的自适应步长选择。 (英语) Zbl 1478.93745号 Automatica公司 135,文章ID 109940,6 p.(2022).MSC公司:93E20型 93E35型 93B70型 PDF格式BibTeX公司 XML格式引用 \textit{S.Xie}等人,Automatica 135,文章ID 109940,6 p.(2022;Zbl 1478.93745) 全文: DOI程序
李在阳;理查德·萨顿。 连续时间和空间中强化学习问题的策略迭代——基本理论和方法。 (英语) Zbl 1461.93143号 Automatica公司 126,文章ID 109421,15 p.(2021).MSC公司:93B47码 93立方厘米 49J30型 PDF格式BibTeX公司 XML格式引用 \textit{J.Lee}和\textit{R.S.Sutton},自动化126,文章ID 109421,第15页(2021;Zbl 1461.93143) 全文: DOI程序 arXiv公司
陈慈;Lewis,Frank L。;谢、坎;谢胜利;刘一璐 异构多智能体系统自适应最优输出同步的非策略学习。 (英语) Zbl 1451.93012号 Automatica公司 119,文章ID 109081,第6页(2020).MSC公司:93甲16 93C40型 93B70型 93B52号 PDF格式BibTeX公司 XML格式引用 \textit{C.Chen}等人,Automatica 119,文章ID 109081,6 p.(2020;Zbl 1451.93012) 全文: DOI程序
姜毅;范嘉璐;高,渭南;柴天佑;Lewis,Frank L。 非线性离散时间多智能体系统的合作自适应最优输出调节。 (英语) Zbl 1448.93159号 Automatica公司 121,文章ID 109149,10 p.(2020).MSC公司:93C40型 93甲16 93C55美元 93立方厘米 93B52号 49号35 PDF格式BibTeX公司 XML格式引用 \textit{Y.Jiang}等人,Automatica 121,文章ID 109149,10 p.(2020;Zbl 1448.93159) 全文: DOI程序
庞波;蒋忠平;伊文·玛丽尔斯 连续时间线性周期系统自适应最优控制的强化学习。 (英语) Zbl 1447.93177号 Automatica公司 118,文章ID 109035,第8页(2020年).MSC公司:93C40型 93二氧化碳 49甲15 PDF格式BibTeX公司 XML格式引用 \textit{B.Pang}等人,Automatica 118,文章ID 109035,8 p.(2020;Zbl 1447.93177) 全文: DOI程序
阿德达波·奥德库勒;高,渭南;马苏德·达瓦里;蒋忠平 多层线性不确定系统的强化学习和非零和博弈输出调节。 (英语) Zbl 1430.93119号 Automatica公司 112,文章ID 108672,8 p.(2020).MSC公司:93C40型 93B52号 91A23型 91A26型 91A80型 49纳米90 93立方厘米 93二氧化碳 PDF格式BibTeX公司 XML格式引用 \textit{A.Odekunle}等人,Automatica 112,文章ID 108672,8 p.(2020;Zbl 1430.93119) 全文: DOI程序
法尔纳兹·阿迪布·亚格梅伊;斯万特·冈纳松;Lewis,Frank L。 使用平均成本强化学习的未知线性系统的输出调节。 (英语) 兹比尔1429.93153 Automatica公司 110,文章ID 108549,第7页(2019年).MSC公司:93立方厘米 93二氧化碳 49甲15 68T05年 PDF格式BibTeX公司 XML格式引用 \textit{F.Adib Yaghmaie}等人,Automatica 110,文章ID 108549,7 p.(2019年;Zbl 1429.93153) 全文: DOI程序 链接
李永强;杨成赞;侯中生;冯元景;尹、陈坤 基于最优误差界分析的数据驱动近似Q学习镇定。 (英语) Zbl 1415.93219号 Automatica公司 103, 435-442 (2019).MSC公司:93D20型 93B40码 49纳米90 68T05年 PDF格式BibTeX公司 XML格式引用 \textit{Y.Li}等人,Automatica 103,435--442(2019;Zbl 1415.93219) 全文: DOI程序
法尔纳兹·阿迪布·亚格梅伊;大卫·J·布朗。 一类连续时间输入约束最优控制问题的强化学习。 (英语) Zbl 1408.49023号 Automatica公司 99, 221-227 (2019).MSC公司:49平方米25 93立方厘米 68T05年 PDF格式BibTeX公司 XML格式引用 \textit{F.Adib Yaghmaie}和\textit{D.J.Braun},自动化99,221--227(2019;Zbl 1408.49023) 全文: DOI程序
瓦姆武达基斯,Kyriakos G。;亨利克·费拉兹 具有最佳性能的连续线性系统的无模型事件触发控制算法。 (英语) Zbl 1378.93083号 Automatica公司 87, 412-420 (2018).MSC公司:93元65角 93B40码 93二氧化碳 93D20型 49N25号 68T05年 PDF格式BibTeX公司 XML格式引用 \textit{K.G.Vamvoudakis}和\textit{H.Ferraz},Automatica 87,412--420(2018;Zbl 1378.93083) 全文: DOI程序
Tor Aksel N.Heirung。;B.埃里克·伊德斯蒂;Foss,Bjarne公司 双自适应模型预测控制。 (英语) Zbl 1370.93316号 Automatica公司 80, 340-348 (2017).MSC公司:93E20型 93E10型 93E12号机组 93C40型 93B40码 93C57 PDF格式BibTeX公司 XML格式引用 \textit{T.A.N.Heirung}等人,Automatica 80,340--348(2017;Zbl 1370.93316) 全文: DOI程序 链接
巴哈雷州基马尔西;Lewis,Frank L。;蒋忠平 \(\mathrm{高}_\线性离散时间系统的控制:非策略强化学习。 (英语) Zbl 1357.93034号 Automatica公司 78, 144-152 (2017).MSC公司:93B36型 68T05年 93C55美元 93二氧化碳 PDF格式BibTeX公司 XML格式引用 \textit{B.Kiumarsi}等人,Automatica 78,144--152(2017;Zbl 1357.93034) 全文: DOI程序
拉西克什·卡马拉普卡尔;乔尔·罗森菲尔德。;沃伦·狄克逊(Warren E.Dixon)。 基于模型的强化学习用于近似在线最优控制。 (英语) Zbl 1348.93167号 Automatica公司 74, 247-258 (2016).MSC公司:93C40型 49纳米90 68T05年 PDF格式BibTeX公司 XML格式引用 \textit{R.Kamalapurkar}等人,Automatica 74,247--258(2016;Zbl 1348.93167) 全文: DOI程序 arXiv公司
拉西克什·卡马拉普卡尔;帕特里克·沃尔特斯;沃伦·狄克逊(Warren E.Dixon)。 基于模型的强化学习用于近似最优调节。 (英语) Zbl 1329.93051号 Automatica公司 64, 94-104 (2016).MSC公司:93B30型 93C40型 68T05年 49纳米90 PDF格式BibTeX公司 XML格式引用 \textit{R.Kamalapurkar}等人,Automatica 64,94-104(2016;Zbl 1329.93051) 全文: DOI程序 arXiv公司
Chang,Hyeong Soo先生 沉睡专家和强盗对约束马尔可夫决策过程的处理方法。 (英语) Zbl 1329.93154号 Automatica公司 63, 182-186 (2016).MSC公司:93E20型 90立方厘米 68T05年 PDF格式BibTeX公司 XML格式引用 \textit{H.S.Chang},Automatica自动化63,182--186(2016;Zbl 1329.93154) 全文: DOI程序 arXiv公司
Lee,Jae Young先生;公园,金贝;Choi、Yoon Ho 连续时间线性二次调节的积分广义策略迭代。 (英语) Zbl 1364.49040号 Automatica公司 50,第2期,475-489(2014).MSC公司:49立方米 49甲10 PDF格式BibTeX公司 XML格式引用 \textit{J.Y.Lee}等人,Automatica 50,No.2,475--489(2014;Zbl 1364.49040) 全文: DOI程序
哈米德雷扎·莫达雷斯;Lewis,Frank L。;Naghibi-Sistani,Mohammad-Bagher 部分未知约束输入连续系统自适应最优控制的积分强化学习和经验重演。 (英语) Zbl 1298.49042号 Automatica公司 50,第1期,193-202(2014).MSC公司:49升20 93C40型 92B20型 68T05年 PDF格式BibTeX公司 XML格式引用 \textit{H.Modares}等人,Automatica 50,No.1,193--202(2014;Zbl 1298.49042) 全文: DOI程序
哈米德雷扎·莫达雷斯;Lewis,Frank L。 基于积分强化学习的非线性部分未知约束输入系统的最优跟踪控制。 (英语) 兹比尔1296.93073 Automatica公司 50,第7期,1780-1792(2014).MSC公司:93立方厘米 68T05年 49立方米 49纳米90 PDF格式BibTeX公司 XML格式引用 \textit{H.Modares}和\textit{F.L.Lewis},Automatica 50,No.7,1780--1792(2014;Zbl 1296.93073) 全文: DOI程序
儿子,唐杜;安孝成;摩尔,凯文·L。 具有指定数据点的最优跟踪问题中的迭代学习控制。 (英语) Zbl 1319.93048号 Automatica公司 49,第5期,1465-1472(2013).MSC公司:93C55美元 93B40码 68T05年 PDF格式BibTeX公司 XML格式引用 \textit{T.D.Son}等人,Automatica 49,No.5,1465--1472(2013;Zbl 1319.93048) 全文: DOI程序
巴辛,S。;卡马拉普尔卡尔,R。;约翰逊,M。;瓦姆武达基斯,K.G。;刘易斯,F.L。;Dixon,W.E。 一种用于不确定非线性系统近似最优控制的新型actor-critic-identifier结构。 (英语) Zbl 1257.93055号 Automatica公司 49,第1期,82-92(2013).MSC公司:93C40型 68T05年 49升20 93D20型 PDF格式BibTeX公司 XML格式引用 \textit{S.Bhasin}等人,Automatica 49,No.1,82--92(2013;Zbl 1257.93055) 全文: DOI程序
林伟松;郑、陈红 使用强化学习代理的约束自适应最优控制。 (英语) Zbl 1271.49016号 Automatica公司 48,第10号,2614-2619(2012).MSC公司:49 K10 93C40型 49升20 PDF格式BibTeX公司 XML格式引用 \textit{W.-S.Lin}和\textit{C.-H.Zheng},Automatica 48,No.10,2614--2619(2012;Zbl 1271.49016) 全文: DOI程序 链接
Yu,T。;周宝龙;陈,K.W。;袁,叶;B·杨。;吴庆华。 \用于互联电网的自动发电控制的(R(\lambda)\)模仿学习。 (英语) Zbl 1258.49067号 Automatica公司 48,第9期,2130-2136(2012).MSC公司:49纳米90 68T05年 PDF格式BibTeX公司 XML格式引用 \textit{T.Yu}等人,Automatica 48,No.9,2130--2136(2012;Zbl 1258.49067) 全文: DOI程序
Lee,Jae Young先生;公园,金贝;Choi、Yoon Ho 连续线性系统自适应最优控制的积分学习和探索策略迭代。 (英语) Zbl 1254.49019号 Automatica公司 48,第11期,2850-2859(2012).MSC公司:49甲10 68T05年 49立方米 PDF格式BibTeX公司 XML格式引用 \textit{J.Y.Lee}等人,Automatica 48,No.11,2850--2859(2012;Zbl 1254.49019) 全文: DOI程序
Nguyen、Dinh Hoa;大卫·班杰德蓬柴 具有时变参数不确定性的线性系统鲁棒迭代学习控制的凸优化方法。 (英语) Zbl 1233.49016号 Automatica公司 47,第9期,2039-243(2011).MSC公司:49甲10 90C25型 68T05年 PDF格式BibTeX公司 XML格式引用 \textit{D.H.Nguyen}和\textit{D.Banjerdpongchai},Automatica 47,No.9,2039--2043(2011;Zbl 1233.49016) 全文: DOI程序
瓦姆武达基斯,Kyriakos G。;Lewis,Frank L。 多玩家非零和游戏:耦合Hamilton-Jacobi方程的在线自适应学习解。 (英语) Zbl 1237.91015号 Automatica公司 47,第8期,1556-1569(2011).MSC公司:91A06型 91A26型 49号70 PDF格式BibTeX公司 XML格式引用 \textit{K.G.Vamvoudakis}和\textit{F.L.Lewis},自动化47,第8期,1556--1569(2011;Zbl 1237.91015) 全文: DOI程序
林伟松 增强综合自适应最优控制的最优性和收敛性。 (英语) Zbl 1233.49019号 Automatica公司 47,第5期,1047-1052(2011).MSC公司:49号35 49 K10 93C40型 49升20 PDF格式BibTeX公司 XML格式引用 \textit{W.-S.Lin},Automatica 47,No.5,1047--1052(2011;Zbl 1233.49019) 全文: DOI程序
拉胡尔·贾恩;普拉文·瓦莱亚 基于模拟的马尔可夫决策过程优化:一种经验过程理论方法。 (英语) Zbl 1204.93132号 Automatica公司 46,第8期,1297-1304(2010).MSC公司:93E20型 60J10型 68T05年 90立方厘米 PDF格式BibTeX公司 XML格式引用 \textit{R.Jain}和\textit{P.Varaiya},Automatica 46,编号8,1297-1304(2010;Zbl 1204.93132) 全文: DOI程序
沙拉布·巴特纳加;理查德·萨顿。;穆罕默德·加瓦姆扎德;马克·李 自然actor-critic算法。 (英语) Zbl 1183.93130号 Automatica公司 45,第11号,2471-2482(2009).MSC公司:93E35型 93E25型 60J20型 49升20 PDF格式BibTeX公司 XML格式引用 \textit{S.Bhatnagar}等人,Automatica 45,No.11,2471-2482(2009;Zbl 1183.93130) 全文: DOI程序
汤姆,乌门;杰罗·范德维迪文;奥科·博斯格拉 在迭代学习控制中抑制样本间行为。 (英语) Zbl 1162.93380号 Automatica公司 45,第4期,981-988(2009).MSC公司:93C57 68T05年 93元62角 PDF格式BibTeX公司 XML格式引用 \textit{T.Oomen}等人,Automatica 45,第4期,981-988(2009;Zbl 1162.93380) 全文: DOI程序 链接
阿斯玛Al-Tamimi;Lewis,Frank L。;穆拉德·阿布·哈拉夫 线性离散时间零和对策的无模型(Q-)学习设计及其在控制中的应用。 (英语) Zbl 1137.93321号 Automatica公司 43,第3期,473-481(2007).MSC公司:93B36型 68T05年 68问题32 49升20 93C40型 91A50型 PDF格式BibTeX公司 XML格式引用 \textit{A.Al-Tamimi}等人,Automatica 43,No.3,473--481(2007;Zbl 1137.93321) 全文: DOI程序
Gadkar,Kapil G。;拉德赫里什南·马哈德万;弗朗西斯·多伊尔(Francis J.III Doyle) 间歇式生物反应器控制中的最优遗传操作。 (英语) Zbl 1114.93014号 Automatica公司 42,第10期,1723-1733(2006).MSC公司:93甲15 92D10型 93E35型 93B40码 PDF格式BibTeX公司 XML格式引用 \textit{K.G.Gadkar}等人,Automatica 42,No.10,1723-1733(2006;Zbl 1114.93014) 全文: DOI程序
沙拉布·巴特纳加;J.Ranjan,Panigrahi 层次马尔可夫决策过程的参与者关键算法。 (英语) Zbl 1102.93043号 Automatica公司 42,第4期,637-644(2006).MSC公司:93E35型 93E03型 93E20型 PDF格式BibTeX公司 XML格式引用 \textit{S.Bhatnagar}和\textit{J.R.Panigrahi},Automatica 42,No.4,637--644(2006;Zbl 1102.93043) 全文: DOI程序
拉德哈坎特·帕迪;Balakrishnan,S.N。;蒂莫西·伦道夫 分布参数系统基于自适应临界的最优神经控制综合。 (英语) Zbl 1012.93025号 Automatica公司 37,第8期,1223-1234(2001). 审核人:A.V.Balakrishnan(洛杉矶) MSC公司:93亿B50 68T05年 93C20美元 49甲10 49升20 93立方厘米 92B20型 PDF格式BibTeX公司 XML格式引用 \textit{R.Padhi}等人,Automatica 37,第8期,1223--1234(2001;Zbl 1012.93025) 全文: DOI程序
约翰·齐齐克利斯(John N.Tsitsiklis)。;本杰明·范罗伊 平均成本时间差异学习。 (英语) Zbl 0932.93085号 Automatica公司 35,第11期,1799-1808(1999). 审核人:王成树(丹佛) MSC公司:93E20型 90立方厘米 49升20 93E35型 PDF格式BibTeX公司 XML格式引用 \textit{J.N.Tsitsiklis}和\textit{B.Van Roy},Automatica 35,No.111799--1808(1999;Zbl 0932.93085) 全文: DOI程序
梅特利,A.L。;T·约内亚马。 使用近似矩的随机系统的两级对偶次优控制器。 (英语) Zbl 0828.93070号 Automatica公司 1949-1954年第12期第30页(1994年). 审核人:A.A.Pervozvanskij(圣佩特堡) MSC公司:93E20型 93E35型 93C55美元 PDF格式BibTeX公司 XML格式引用 \textit{A.L.Maitelli}和\textit{T.Yoneyama},Automatica 30,No.12949-1954(1994;Zbl 0828.93070) 全文: DOI程序
van Amerongen,J。 船舶自适应转向模型参考方法。 (英语) Zbl 0527.93043号 Automatica公司 20, 3-14 (1984).MSC公司:93C40型 2005年第70季度 93E11号机组 62M20型 68T05年 76B20型 93E10型 93E25型 PDF格式BibTeX公司 XML格式引用 \textit{J.van Amerongen},自动化20,3--14(1984;Zbl 0527.93043) 全文: DOI程序
阿赛,K。;南岛北岛。 使用模糊自动机进行优化控制。 (英语) Zbl 0226.93033号 Automatica公司 8, 101-104 (1972).MSC公司:93E20型 93E35型 PDF格式BibTeX公司 XML格式引用 \textit{K.Asai}和\textit{S.Kitajima},自动化8,101--104(1972;Zbl 0226.93033) 全文: DOI程序