吴波;李凌飞 区域切换市场中连续时间均值-方差投资组合选择的强化学习。 (英语) Zbl 07865861号 《经济学杂志》。动态。控制 158,文章ID 104787,28 p.(2024).MSC公司:91至XX PDF格式BibTeX公司 XML格式引用 \textit{B.Wu}和textit{L.Li},J.Econ。动态。控制158,文章ID 104787,第28页(2024;Zbl 07865861) 全文: 内政部
瑞安·唐纳利;塞巴斯蒂安·贾姆加尔 利用Tsallis熵对潜在因素模型进行探索性控制。 (英语) Zbl 1533.93841号 SIAM J.财务。数学。 第15期,第1期,第26-53页(2024年).MSC公司:93年20日 94甲17 PDF格式BibTeX公司 XML格式引用 \textit{R.Donnelly}和\textit{S.Jaimungal},SIAM J.Financ。数学。15,编号1,26-53(2024;Zbl 1533.93841) 全文: 内政部 arXiv公司
卢卡斯·斯普鲁奇;塔努特Treetanthiploet;张宇飞 连续时间线性二次强化学习中熵正则化器的优化调度。 (英语) Zbl 07791452号 SIAM J.控制优化。 62,编号1,135-166(2024).MSC公司:62升05 49甲10 93E35型 94甲17 PDF格式BibTeX公司 XML格式引用 \textit{L.Szpruch}等人,SIAM J.控制优化。62,编号1,135--166(2024;Zbl 07791452) 全文: 内政部 arXiv公司