@前缀xsd:.@前缀rdf:.@前缀rdfs:.@前缀owl:.@前缀bf:.@前缀bibo:.@前缀bibtex:.@前缀cito:.@前缀datacite:.@前缀dbo:.@前缀dc:.@前缀dct:.@前缀foaf:.@前缀升:.@前缀locid:.@前缀locrel:.@前缀架构:.@前缀wd:.@前缀wdt:.@前缀dblp:.猫头鹰:相同.rdfs:标签“Kory W.Mathewson和Patrick M.Pilarski:演员-关键强化学习与同步人类控制和反馈”(2017);数据引用:hasIdentifier[数据引用:usesIdentifierScheme数据引用:dblp-record;升:hasLiteralValue“journals/corr/MathewsonP17a”;数据引用:ResourceIdentifier], [数据引用:usesIdentifierScheme数据引用:arxiv;升:hasLiteralValue“1703.01274”;数据引用:ResourceIdentifier] ;dblp:标题为“演员-评论家强化学习与同时的人类控制和反馈。”;dblp:bibtexType bibtex:文章;dblp:作者,;dblp:创建者数量2;dblp:hasSignature(签名)[dblp:signatureDblpName“Kory W.Mathewson”;dblp:signatureCreator;dblp:符号序号1;dblp:签名发布;a dblp:作者签名], [dblp:signatureDblpName“Patrick M.Pilarski”;dblp:signatureCreator;dblp:签名序号2;dblp:签名发布;a dblp:作者签名] ;dblp:primaryDocumentPage(主文档页);dblp:documentPage;dblp:在TocPage上列出;dblp:在“CoRR”中发布;dblp:publishedInJournal“CoRR”;dblp:publishedInJournalVolume“abs/1703.01274”;dblp:出版年份“2017”^^;a dblp:出版,dblp:非正式。rdfs:标签“dblp记录'journals/corr/MathewsonP17a'的RDF数据的起源信息”;dct:创建者;dct:是的一部分;dct:修改为“2021-12-17T1:39:29+0100”;dct:许可证.