陈再伟;约翰·鲍尔·克拉克;Siva Theja Maguluri 目标网络和截断克服了(Q)学习中致命的三元组。 (英语) Zbl 07786787号 SIAM J.数学。数据科学。 5,第4期,1078-1101(2023).MSC公司:68T05型 68T07型 68T09号 90立方厘米 62L20型 PDF格式BibTeX公司 XML格式引用 \textit{Z.Chen}等人,SIAM J.Math。数据科学。5,编号4,1078--1101(2023;Zbl 07786787) 全文: 内政部 arXiv公司
陈再伟;张生;Doan,Thinh T。;约翰·鲍尔·克拉克;Siva Theja Maguluri 非线性随机逼近的有限样本分析及其在强化学习中的应用。 (英语) Zbl 1504.93364号 Automatica公司 146,文章ID 110623,第14页(2022).MSC公司:93E03型 93立方厘米 68T05型 PDF格式BibTeX公司 XML格式引用 \textit{Z.Chen}等人,Automatica 146,文章ID 110623,14 p.(2022;Zbl 1504.93364) 全文: 内政部 arXiv公司