. . . . . “Richard Archibald等人：参数化环境下强化学习的随机最大值原理方法。（2023）”。 . . _：ID_dd3f435976c1ad093fc33bb3bb8d460a。_：ID_dd3f435976c1ad093fc33bb3bb8d460a ._：ID_dd3f435976c1ad093fc33bb3bb8d460a ._：ID_dd3f435976c1ad093fc33bb3bb8d460a“期刊/jcphy/ArchibaldBY23”。 _：ID_d5ba985031ca70869bdf08700ea83c25。_：ID_d5ba985031ca70869bdf08700ea83c25 ._：ID_d5ba985031ca70869bdf08700ea83c25 ._：ID_d5ba985031ca70869bdf08700ea83c25“10.1016/J.JCP.2023.112238”。 “参数化环境下强化学习的随机最大值原理方法”。 . . . . "3"^^. _：Sig_ca2162366b55484d2ca55a90b020e14e_1。_：Sig_ca2162366b55484d2ca55a90b020e14e_1 ._：Sig_ca2162366b55484d2ca55a90b020e14e_1“理查德·阿奇博尔德”。_：Sig_ca2162366b55484d2ca55a90b020e14e_1 ._：Sig_ca2162366b55484d2ca55a90b020e14e_1 ._：Sig_ca2162366b55484d2ca55a90b020e14e_1"1"^^._：Sig_ca2162366b55484d2ca55a90b020e14e_1 . _：Sig_ca2162366b55484d2ca55a90b020e14e_2。_：Sig_ca2162366b55484d2ca55a90b020e14e_2 ._：Sig_ca2162366b55484d2ca55a90b020e14e_2“丰宝0005”。_：Sig_ca2162366b55484d2ca55a90b020e14e_2 ._：Sig_ca2162366b55484d2ca55a90b020e14e_2 ._：Sig_ca2162366b55484d2ca55a90b020e14e_2"2"^^._：Sig_ca2162366b55484d2ca55a90b020e14e_2 . _：Sig_ca2162366b55484d2ca55a90b020e14e_3。_：Sig_ca2162366b55484d2ca55a90b020e14e_3 ._：Sig_ca2162366b55484d2ca55a90b020e14e_3“炯敏勇”。_：Sig_ca2162366b55484d2ca55a90b020e14e_3 ._：Sig_ca2162366b55484d2ca55a90b020e14e_3"3"^^._：Sig_ca2162366b55484d2ca55a90b020e14e_3 . . . . "112238" . 《计算物理学杂志》。《计算物理学杂志》。 "488" . "2023"^^. "--09"^^. “dblp记录'journals/jcphy/ArchibaldBY23'的RDF数据的起源信息”。 . . . “2024-05-07T20:21:14+0200”。