韩、夏;王若都;周迅余 连续强化学习的Choquet正则化。 (英语) Zbl 07748432号 SIAM J.控制优化。 61,第5号,2777-2801(2023).MSC公司:68泰克 PDF格式BibTeX公司 XML格式引用 \textit{X.Han}等人,SIAM J.控制优化。61,第5号,2777--2801(2023;Zbl 07748432) 全文: 内政部 arXiv公司
丹尼尔·巴特尔;迈克尔·库珀;卢克斯,提伯特;安东尼斯·帕帕潘托利昂;斯蒂芬·埃克斯坦 边际和依赖性不确定性:边界、最佳传输和清晰度。 (英语) Zbl 1483.60031号 SIAM J.控制优化。 60,第1号,410-434(2022).MSC公司:60埃15 49甲15 28A35型 9120国集团 第49季度22 PDF格式BibTeX公司 XML格式引用 \textit{D.Bartl}等人,SIAM J.控制优化。60,第1号,410-434(2022;Zbl 1483.60031) 全文: 内政部 arXiv公司