拉西克什·卡马拉普卡尔;帕特里克·沃尔特斯;乔尔·罗森菲尔德;沃伦·狄克逊 强化学习实现最佳反馈控制。基于Lyapunov的方法。 (英语) Zbl 1403.49001号 通信与控制工程查姆:施普林格(ISBN 978-3-319-78383-3/hbk;978-3-3169-78384-0/电子书)。十六、293页。(2018). 审核人:AndrzejŚwierniak(格利维塞) MSC公司:49-02 49升20 93B52号 93B40码 93亿B51 93D05型 93D15号 91A23型 49N90型 92秒20 PDF格式BibTeX公司 XML格式引用 \textit{R.Kamalapurkar}等人,最优反馈控制的强化学习。一种基于Lyapunov的方法。查姆:斯普林格(2018;Zbl 1403.49001) 全文: DOI程序
拉西克什·卡马拉普卡尔;乔尔·罗森菲尔德。;沃伦·狄克逊(Warren E.Dixon)。 基于模型的强化学习用于近似在线最优控制。 (英语) Zbl 1348.93167号 Automatica公司 74, 247-258 (2016).MSC公司:93C40型 49N90型 68T05型 PDF格式BibTeX公司 XML格式引用 \textit{R.Kamalapurkar}等人,Automatica 74,247--258(2016;Zbl 1348.93167) 全文: DOI程序 arXiv公司
拉西克什·卡马拉普卡尔;帕特里克·沃尔特斯;沃伦·狄克逊(Warren E.Dixon)。 基于模型的强化学习用于近似最优调节。 (英语) 兹比尔1329.93051 Automatica公司 64, 94-104 (2016).MSC公司:93B30型 93C40型 68T05型 49N90型 PDF格式BibTeX公司 XML格式引用 \textit{R.Kamalapurkar}等人,Automatica 64,94-104(2016;Zbl 1329.93051) 全文: DOI程序 arXiv公司
巴辛,S。;卡马拉普尔卡尔,R。;约翰逊,M。;瓦姆武达基斯,K.G。;刘易斯,F.L。;Dixon,W.E。 一种用于不确定非线性系统近似最优控制的新型actor-critic-identifier结构。 (英语) Zbl 1257.93055号 Automatica公司 49,第1期,82-92(2013).MSC公司:93C40型 68T05型 49升20 93D20型 PDF格式BibTeX公司 XML格式引用 \textit{S.Bhasin}等人,Automatica 49,No.1,82--92(2013;Zbl 1257.93055) 全文: DOI程序