{“状态”:“确定”,“消息类型”:“工作”,“信息版本”:“1.0.0”,“邮件”:{“索引”:{-“日期部分”:[[2024,8,6]],“日期时间”:“2024-08-06T02:37:07Z”,“时间戳”:1722911827602},“引用计数”:0,“发布者”:“人工智能发展协会(AAAI)”,“问题”:“1”,“内容域”:{“域”:[],“交叉标记限制”:false},“short container-title”:[“AAAI”],“抽象”:“\应急意识是一种认识,即未来观察的某些方面由代理人控制,而其他方面则完全由环境决定。本文以Atari 2600游戏为平台,探讨强化学习中的权变意识。我们介绍了一种精确识别关联区域的技术,并描述了如何利用此知识生成改进的特征以用于值函数近似。我们用46款看不见的、多样化的、富有挑战性的游戏对Atari 2600游戏机的技术性能进行了实证评估。我们的结果表明,权变意识对于无模型强化学习代理来说是一个普遍有用的概念。\n\n<\/jats:p>“,”DOI“:”10.1609\/aaai.v26i1.8321“,”type“:”journal-article“,”created“:{”date-parts“:[2022,6,1]],”date-time“:”2022-06-01T20:35:08Z“,”timestamp“:16541157080000},”page“:“864-871”,“source”:“Crossref”,“is-referenced-by-count”:11,“title”:[“使用Atari 2600游戏调查应急意识”],“前缀“:”10.1609“,”卷“:”26“,”author“:[{”given“:”Marc“,”family“:”Bellemare“,”sequence“:”first“,”affiliation“:[]},{”fixed“:”Joel“,”家庭“:”Veness“,”序列“:”additional“,”filiation”:[]neneneep,{“given”:“Michael”,“family”:“Bowling”,“sequence”:“additional”,“affiliance”:[]},“member”:“9382”,“published on”:{“date-parts”:[2021,9]20]]},“集装箱标签”:[“AAAI人工智能会议记录“],“original-title”:[],“link”:[{“URL”:“https:\/\/ojs.AAAI.org\/index.php\/AAAI\/aarticle\/download\/8321\/8180”,“content-type”:“application\/pdf”,“content-version”:“vor”,“intended-application”:“text-mining”},{“URL”:“http://\/ojs.AAAI.org\/index.php\AAAI\/article\/ownload\/832 \/8180“,”content-type“:”unspecified“,”content-version“:”vor“,”intended-application“:”similarity-checking“}],”deposed“:{”date-parts“:[2022,6,21]],”date-time“:“2022-06-21T20:00:42Z”,“timestamp”:1655841642000},“score”:1,“resource”:{“primary”:{“URL”:“https:\/\/ojs.aaaai.org\/index.php\/AAAAI\/article\/view\/8321”}},“副标题”:[],“短标题”:[],“发布”:{”date-parts“:[[2021,9,20]]},“references-count”:0,“journal-issue”:{“issue”:“1”,“published-on-line”:{“date-part”:[[2012,7,26]]}},”URL“:”http://\/dx.doi.org\/10.1609\/aaai.v26i1.8321“,”relation“:{},‘ISSN’:[”2374-3468“,”2159-5399“],”ISSN-type“:[{”value“:”2374-3468“,”类型“:”电子“},{”值“:”2159-5399“,”型号“:”打印“}],”主题“:[],”发布“:{”日期部分“:[[2021,9,20]]}}}