. . . . . “Richard Archibald等人:参数化环境下强化学习的随机最大值原理方法。(2023)”。 . . _:ID_dd3f435976c1ad093fc33bb3bb8d460a。_:ID_dd3f435976c1ad093fc33bb3bb8d460a ._:ID_dd3f435976c1ad093fc33bb3bb8d460a ._:ID_dd3f435976c1ad093fc33bb3bb8d460a“期刊/jcphy/ArchibaldBY23”。 _:ID_d5ba985031ca70869bdf08700ea83c25。_:ID_d5ba985031ca70869bdf08700ea83c25 ._:ID_d5ba985031ca70869bdf08700ea83c25 ._:ID_d5ba985031ca70869bdf08700ea83c25“10.1016/J.JCP.2023.112238”。 “参数化环境下强化学习的随机最大值原理方法”。 . . . . "3"^^. _:Sig_ca2162366b55484d2ca55a90b020e14e_1。_:Sig_ca2162366b55484d2ca55a90b020e14e_1 ._:Sig_ca2162366b55484d2ca55a90b020e14e_1“理查德·阿奇博尔德”。_:Sig_ca2162366b55484d2ca55a90b020e14e_1 ._:Sig_ca2162366b55484d2ca55a90b020e14e_1 ._:Sig_ca2162366b55484d2ca55a90b020e14e_1"1"^^._:Sig_ca2162366b55484d2ca55a90b020e14e_1 . _:Sig_ca2162366b55484d2ca55a90b020e14e_2。_:Sig_ca2162366b55484d2ca55a90b020e14e_2 ._:Sig_ca2162366b55484d2ca55a90b020e14e_2“丰宝0005”。_:Sig_ca2162366b55484d2ca55a90b020e14e_2 ._:Sig_ca2162366b55484d2ca55a90b020e14e_2 ._:Sig_ca2162366b55484d2ca55a90b020e14e_2"2"^^._:Sig_ca2162366b55484d2ca55a90b020e14e_2 . _:Sig_ca2162366b55484d2ca55a90b020e14e_3。_:Sig_ca2162366b55484d2ca55a90b020e14e_3 ._:Sig_ca2162366b55484d2ca55a90b020e14e_3“炯敏勇”。_:Sig_ca2162366b55484d2ca55a90b020e14e_3 ._:Sig_ca2162366b55484d2ca55a90b020e14e_3"3"^^._:Sig_ca2162366b55484d2ca55a90b020e14e_3 . . . . "112238" . 《计算物理学杂志》。 《计算物理学杂志》。 "488" . "2023"^^. "--09"^^. “dblp记录'journals/jcphy/ArchibaldBY23'的RDF数据的起源信息”。 . . . “2024-05-07T20:21:14+0200”。