{“状态”:“确定”,“消息类型”:“工作”,“信息版本”:“1.0.0”,“邮件”:{“索引”:{-“日期部分”:[[2024,9,3]],“日期时间”:“2024-09-03T02:11:15Z”,“时间戳”:1725329475152},“引用-计数”:0,“发布者”:“AI Access Foundation”,“内容域”:{“域”:[],“交叉标记限制”:false},”短容器时间“:[”jair“],“摘要“:”本文介绍了一种设计可扩展通用强化学习代理的原理方法。我们的方法基于AIXI的直接近似,AIXI是用于一般强化学习代理的贝叶斯最优概念。此前,AIXI的理论是否能推动实际算法的设计尚不清楚。通过为AIXI代理提供第一个计算上可行的近似值,我们肯定地回答了这个迄今为止尚未解决的问题。为了发展我们的近似,我们引入了一种新的Monte-Carlo树搜索算法,并对上下文树加权算法进行了特定于代理的扩展。从经验上讲,我们在各种随机和部分可观测的域上给出了一组令人鼓舞的结果。最后,我们提出了一些未来研究的方向<\/jats:p>“,”DOI“:”10.1613\/jair.3125“,”type“:”journal-article“,”created“:{”date-parts“:[[2018,7,17]],”date-time“:”2018-07-17T14:39:11Z“,”timestamp“:1531838351000},”page“:“95-142”,“source”:“Crossref”,“is-referenced-by-count”:65,“title”:[“A Monte-Carlo AIXI近似值”],“前缀”:“10.1613”,“卷“:”40“,”作者“:[{”给定“:”J“,”家庭“:”威尼斯“,”sequence“:”first“,”affiliation“:[]},{“given”:“K.S.”,“family”:“Ng”,“sequence”:“additional”,“affiliance”:[]{“给定的”:“M.”,“家族”:“Hutter”,“序列”:“附加的”,“从属关系”:[]},}“giving”:“W”,“家庭”:“Uther”,附加“,”从属“:[]}],”成员“:”16860“,”published-online“:{“date-parts”:[[2011,1,24]]},“container-title”:[“Journal of Artificial Intelligence Research”],“原始标题”:[],“链接”:[{“URL”:“https:\/\/jair.org\/index.php\/jair \/article \/download\/10685\/25533”,“内容类型”:“application\/pdf”,“content-version”:“vor”,“intended-application”:“text-mining”},{“URL”:“”https:\/\/jair.org\/index.php\/jair \/article \/download\/10685\/25532“,“content-type”:“application\/postscript”,“content-version”:“vor”,“intended-application”:“text-mining”},{“URL”:“https:\//jair.org\\index.php/jair \/article\/dowwnload\/10665\/2533”,“内容类型”:“unspecified”,“content-version“:”vor“,”intended-epplication“:”类似y检查“}],“deposed”:{“date-parts”:[[2019,10,19]],“date-time”:“2019-10-19T22:30:11Z”,“timestamp”:1571524211000},“score”:1,“resource”:}“primary”:{“URL”:“https:\/\/jair.org\/index.php\/jair \/article\/view\/10685”},”subtitle“:[],”shorttitle“:[],”issued“:{”date-part“:[2011,24]]},nces-count“:0,”URL“:”http://\/dx.doi.org\/10.1613\/jair.3125“,“关系”:{},“ISSN”:[“1076-9757”],“ISSN类型”:[{“值”:“1076-9757”,“类型”:“电子”}],“主题”:[],“已发布”:{“日期部分”:[[2011,1,24]]}}