提供商:Schloss Dagstuhl-莱布尼茨信息中心数据库:dblp计算机科学书目内容:文本/纯文本;charset=“utf-8”TY-JOUR公司ID-DBLP:期刊/jcphy/ArchibaldBY23澳大利亚——理查德·阿奇博尔德阿宝,冯AU-Yong、JiongminTI-参数化环境下强化学习的随机最大值原理方法。JO-J.计算。物理学。VL-488SP-112238PY-2023/09年/DO-2016年10月10日/J.JCP.2023.112238UR-(欧元)https://doi.org/10.1016/j.jcp.2023.112238急诊室-