. . . “Kory W.Mathewson和Patrick M.Pilarski:同时进行人类控制和反馈的演员-评论家强化学习。(2017)”。 _:ID_c252446b1feb8e52d6f892020024a511。_:ID_c252446b1feb8e52d6f892020024a511 ._:ID_c252446b1feb8e52d6f892020024a511 ._:ID_c252446b1feb8e52d6f892020024a511“期刊/corr/MathewsonP17a”。 _:ID_4e07f1e75da9a6ff28b8ba0dd9674d2a。_:ID_4e07f1e75da9a6ff28b8ba0dd9674d2a ._:ID_4e07f1e75da9a6ff28b8ba0dd9674d2a ._:ID_4e07f1e75da9a6ff28b8ba0dd9674d2a"1703.01274" . “演员-评论家强化学习与同时的人类控制和反馈”。 . . . “2”^^. _:Sig_49020c0b1e68e20e5da859a1fea1f8cd_1。_:Sig_49020c0b1e68e20e5da859a1fea1f8cd_1 ._:Sig_49020c0b1e68e20e5da859a1fea1f8cd_1“Kory W.Mathewson”。_:Sig_49020c0b1e68e20e5da859a1fea1f8cd_1 ._:Sig_49020c0b1e68e20e5da859a1fea1f8cd_1"1"^^._:Sig_49020c0b1e68e20e5da859a1fea1f8cd_1 . _:信号_49020c0b1e68e20e5da859a1fea1f8cd_2。_:Sig_49020c0b1e68e20e5da859a1fea1f8cd_2 ._:Sig_49020c0b1e68e20e5da859a1fea1f8cd_2“Patrick M.Pilarski”。_:Sig_49020c0b1e68e20e5da859a1fea1f8cd_2 ._:Sig_49020c0b1e68e20e5da859a1fea1f8cd_2“2”^^._:Sig_49020c0b1e68e20e5da859a1fea1f8cd_2 . . . . “CoRR”。 “CoRR”。 “abs/1703.01274”。 "2017"^^. “dblp记录'journals/corr/MathewsonP17a'的RDF数据的来源信息”。 . . . “2021-12-17T11:39:29+0100”。