瑞安·唐纳利;塞巴斯蒂安·贾姆加尔 潜在因子模型的探索性Tsallis熵控制。 (英语) Zbl 1533.93841号 SIAM J.财务。数学。 第15期,第1期,第26-53页(2024年).MSC公司:93E20型 94甲17 PDF格式BibTeX公司 XML格式引用 \textit{R.Donnelly}和\textit{S.Jaimungal},SIAM J.Financ。数学。15,编号1,26-53(2024;Zbl 1533.93841) 全文: 内政部 arXiv公司
卢卡斯·斯普鲁奇;塔努特Treetanthiploet;张宇飞 用于连续时间线性二次强化学习的熵正则化子的最优调度。 (英语) Zbl 07791452号 SIAM J.控制优化。 62,编号1,135-166(2024).MSC公司:62升05 49甲10 93E35型 94甲17 PDF格式BibTeX公司 XML格式引用 \textit{L.Szpruch}等人,SIAM J.控制优化。62,编号1,135--166(2024;Zbl 07791452) 全文: 内政部 arXiv公司
韩,夏;王若都;周迅余 连续强化学习的Choquet正则化。 (英语) Zbl 07748432号 SIAM J.控制优化。 61,第5号,2777-2801(2023).MSC公司:68泰克 PDF格式BibTeX公司 XML格式引用 \textit{X.Han}等人,SIAM J.控制优化。61,编号5,2777--2801(2023;Zbl 07748432) 全文: 内政部 arXiv公司
孙中石;贾广燕 探索性线性二次二人零和随机微分对策的强化学习。 (英语) Zbl 1511.91012号 申请。数学。计算。 442,文章ID 127763,16 p.(2023).MSC公司:91A15型 60华氏30 91A05型 93E20型 PDF格式BibTeX公司 XML格式引用 \textit{Z.Sun}和\textit{G.Jia},应用。数学。计算。442,文章ID 127763,16 p.(2023;Zbl 1511.91012) 全文: 内政部
唐文平;张玉明·保罗;周迅余 探索性HJB方程及其收敛性。 (英语) Zbl 1501.35132号 SIAM J.控制优化。 60,第6期,3191-3216(2022).MSC公司:第35页第21页 60J60型 93E15型 93E20型 PDF格式BibTeX公司 XML格式引用 \textit{W.Tang}等人,SIAM J.控制优化。60,编号6,3191--3216(2022;Zbl 1501.35132) 全文: 内政部 arXiv公司