法尔纳兹·阿迪布·亚格梅伊;斯万特·冈纳松;刘易斯,弗兰克·L。 使用平均成本强化学习的未知线性系统的输出调节。 (英语) 兹比尔1429.93153 Automatica公司 110,文章ID 108549,第7页(2019年).MSC公司:93立方厘米 93二氧化碳 49甲15 68T05型 PDF格式BibTeX公司 XML格式引用 \textit{F.Adib Yaghmaie}等人,Automatica 110,文章ID 108549,7 p.(2019年;Zbl 1429.93153) 全文: 内政部 链接
法尔纳兹·阿迪布·亚格梅伊;大卫·J·布朗。 一类连续时间输入约束最优控制问题的强化学习。 (英语) 兹比尔1408.49023 Automatica公司 99, 221-227 (2019).MSC公司:49平方米25 93立方厘米 68T05型 PDF格式BibTeX公司 XML格式引用 \textit{F.Adib Yaghmaie}和\textit{D.J.Braun},自动化99,221--227(2019;Zbl 1408.49023) 全文: 内政部