{“状态”:“确定”,“消息类型”:“工作”,“信息版本”:“1.0.0”,“邮件”:{“索引”:{“日期部分”:[[2024,2,19]],“日期时间”:“2024-02-19T00:15:09Z”,“时间戳”:1708301709486},“出版商位置”:“柏林,海德堡”,“参考计数”:16,“出版者”:“施普林格-柏林-海德堡(Springer Berlin Heidelberg)”,“isbn-type”:[{“值”:“9783540654803”,“类型”:“打印”},{“值”:“9783540492405”,“type”:“electronic”}],“content-domain”:{“domain”:[],“crossmark-restriction”:false},“short-container-title”:[],”published-print“:{”date-parts“:[[1998]]},”DOI“:”10.1007\/3-540-49240-2_5“,”type“:”book-chapter“,”created“:”{“date-part”:[2007,11,11]],“date-time”:“2007-111T06:39:53Z“,”时间戳“:1194763193000},”页面“:”62-78“,”源“:“Crossref”,“is-referenced-by-count”:5,“title”:[“基于视觉的状态空间构建,用于在多Agent环境中学习移动机器人”],“prefix”:“10.1007”,”author“:[{”given“:”Eiji“,”family“:”Uchibe“,”sequence“:”first“,”affiliation“:[]},{“given”:“Minoru”,“family”:“Asada”:“Hosoda”,“sequence”:“additional”,“affiliation”:[]}],“member”:“297”,“在线发布”:{“date parts”:[[2000,6,9]]},“reference”:[{“key”:“5_CR1”,“doi asserted by”:“crossref”,“nonstructured”:“H.Akaike.统计模型识别的新视角。IEEE Trans.AC-19,第716\u20137231974页。”,“doi”:“10.1007\/978-1-4612-1694-0_16”},{“key”:“5_CR2”,“doi-asserted-by”:“crossref”,“unstructured”:“M.Asada,S.Noda,and K.Hosoda.机器人学习中基于动作的传感器空间分类。1996年IEEE\/RSJ智能机器人和系统国际会议,1996年。”,“doi”:“10.1109\/IROS.1996.569012”},{“key”:“5_CR3”,“doi-asserted-by”:。野田佳彦、S.Tawaratsumida和K.Hosoda。基于视觉的强化学习用于有目的的行为习得。程序中。IEEE机器人与自动化国际会议,第146\u20131531995页。稻叶。远程训练机器人:人工智能与现实世界行为的接口。在ISRR\u201993的预印本中,Pitsuburg,1993。“},{“问题”:“l”,“关键”:“5_CR6”,“首页”:“73”,“卷”:“18”,“作者”:“H.Kitano”,“年份”:“1997”,“非结构化”:“H Kitano,M.Asada,Y.Kuniyoshi,I.Noda,E.Osawa,和H.Matsubara。机器人杯是人工智能杂志的挑战问题,18(l):73\u2013851997。”,“新闻标题”:“人工智能杂志”},{“密钥”:“5_CR7“,”doi-asserted-by“:”crossref“,”unstructured“:”W.E.Larimore“。识别、滤波和自适应控制中的典型变量分析。程序中。第29届IEEE决策与控制会议,第596\u2013604页,夏威夷火奴鲁鲁,1990年12月。米切尔。用隐藏状态强化学习。程序中。第二届自适应行为模拟国际会议:从动物到动画2.,第271\u20132801992页。“,”DOI“:”10.7551\/mitpress\/3116.003.038“},{“key”:“5_CR9”,“DOI-asserted-by”:“crossref”,“unstructured”:“M.L。利特曼。马尔可夫博弈作为多智能体强化学习的框架。程序中。第11届国际机器学习会议,第157\u2013163页,1994年。“,”DOI“:”10.1016\/B978-1-55860-335-6.50027-1“},{”key“:”5_CR10“,”first page“:“199”,“volume”:“21”,”author“:”A.W.Moore“,”year“:”1995“,”unstructured“:”A.W.Moole和C.G。阿特克森。多维状态空间中可变分辨率强化学习的parti-game算法。机器学习,21:199\u20132331995。“,“journal-title”:“机器学习”},{“key”:“5_CR11”,“doi-asserted-by”:“crossref”,“unstructured”:“T.W.Sandholm和R.H.Crites.论半竞争领域中的多智能体Q-学习。多智能体系统适应和学习研讨会笔记,IJCAI-951995。”,“doi”:“10.1007\/3-540-60923-7_28“},{“key”:“5_CR12”,“unstructured”:“P.Stone and M.Veloso.Using machine learning in the soccer server.in Proc.of IROS-96 Workshop on Robocup,1996.”},“key“:”5_CR13“,”doi-asserted-by“:”crossref“,”unstructure“:”E.Uchibe,M.Asada,and K。细田章男。使用模块化强化学习的移动机器人行为协调。程序中。1996年IEEE RSJ智能机器人和系统国际会议,第1329\u20131336页,1996年。“,”DOI“:”10.1109\/IROS.1996.568989“},{“key”:“5_CR14”,“DOI-asserted-by”:“crossref”,“unstructured”:“E.Uchibe,M.Asada,and K。细田章男。基于视觉的学习型移动机器人环境复杂性控制。程序中。IEEE机器人与自动化国际会议,1998年(即将推出)。“,”DOI“:”10.1109\/ROBOT.1998.680514“},{”issue“:”12“,”key“:”5_CR15“,”DOI-asserted-by“:”publisher“,”first page“:“1853”,”DOI:“10.1016\/0005-1098(95)00072-0”,“volume”:“31”,“author”:“P.Overschee-Van”,“year”:“1995”,“unstructured”:”P.Van Overschee和B.De Moor。三个子空间系统识别算法的统一定理。Automatica,31(12):1853\u201318641995.“,”journal-title“:”Automatica“},{“key”:“5_CR16”,“doi-asserted-by”:“crossref”,“unstructured”:“C.J.C.H.Watkins和P.Dayan.技术说明:Q-learning。机器学习,第279\u20132921992.”,“doi”:“10.1007\/BF00992698”}],“container-title”:[“学习机器人”,“计算机科学讲义”],“原始标题”:[],“link“:[{”URL“:”http://\/link.springer.com/content\/pdf\/10.1007\/3-540-49240-2_5“,”content-type“:”unspecified“,”content-version“:”vor“,”intended-application“:”similarity-checking“}],”deposed“:{”date-parts“:[2024,2,18]],”date-time“:“2024-02-18T23:31:05Z”,“timestamp”:170829906500},“score”:1,“resource”:{“primary”:{“URL”:“http://\/link.springer.com/10.1007\/3-540-49240-2_5“}},”副标题“:[],”短标题“:[],”已发布“:{”日期部分“:[[1998]]},“ISBN”:[“9783540654803”,“97835492405”],”引用计数“:16,”URL“:”http://\/dx.doi.org\/10.10007\/3-504-49240-2_5 2-9743“],”ISSN-type“:[{”value“:”0302-9743“,”type“:”print“}],”subject“:[],”published“:{”日期部分“:[1998]}}