{“状态”：“确定”，“消息类型”：“工作”，“信息版本”：“1.0.0”，“邮件”：{“索引”：{“日期部分”：[[2024,2,19]]，“日期时间”：“2024-02-19T00:15:09Z”，“时间戳”：1708301709486}，“出版商位置”：“柏林，海德堡”，“参考计数”：16，“出版者”：“施普林格-柏林-海德堡（Springer Berlin Heidelberg）”，“isbn-type”：[{“值”：“9783540654803”，“类型”：“打印”}，{“值”：“9783540492405”，“type”：“electronic”}]，“content-domain”：{“domain”:[]，“crossmark-restriction”：false}，“short-container-title”：[]，”published-print“：{”date-parts“：[[1998]]}，”DOI“：”10.1007\/3-540-49240-2_5“，”type“：”book-chapter“，”created“：”{“date-part”：[2007,11,11]]，“date-time”：“2007-111T06:39:53Z“，”时间戳“：1194763193000}，”页面“：”62-78“，”源“：“Crossref”，“is-referenced-by-count”：5，“title”：[“基于视觉的状态空间构建，用于在多Agent环境中学习移动机器人”]，“prefix”：“10.1007”，”author“：[{”given“：”Eiji“，”family“：”Uchibe“，”sequence“：”first“，”affiliation“：[]}，{“given”：“Minoru”，“family”：“Asada”：“Hosoda”，“sequence”：“additional”，“affiliation”：[]｝]，“member”：“297”，“在线发布”：｛“date parts”：[[2000,6,9]]｝，“reference”：[｛“key”：“5_CR1”，“doi asserted by”：“crossref”，“nonstructured”：“H.Akaike.统计模型识别的新视角。IEEE Trans.AC-19，第716\u20137231974页。”，“doi”：“10.1007\/978-1-4612-1694-0_16”｝，｛“key”：“5_CR2”，“doi-asserted-by”：“crossref”，“unstructured”：“M.Asada，S.Noda，and K.Hosoda.机器人学习中基于动作的传感器空间分类。1996年IEEE\/RSJ智能机器人和系统国际会议，1996年。”，“doi”：“10.1109\/IROS.1996.569012”}，{“key”：“5_CR3”，“doi-asserted-by”：。野田佳彦、S.Tawaratsumida和K.Hosoda。基于视觉的强化学习用于有目的的行为习得。程序中。IEEE机器人与自动化国际会议，第146\u20131531995页。稻叶。远程训练机器人：人工智能与现实世界行为的接口。在ISRR\u201993的预印本中，Pitsuburg，1993。“}，{“问题”：“l”，“关键”：“5_CR6”，“首页”：“73”，“卷”：“18”，“作者”：“H.Kitano”，“年份”：“1997”，“非结构化”：“H Kitano，M.Asada，Y.Kuniyoshi，I.Noda，E.Osawa，和H.Matsubara。机器人杯是人工智能杂志的挑战问题，18（l）：73\u2013851997。”，“新闻标题”：“人工智能杂志”}，{“密钥”：“5_CR7“，”doi-asserted-by“：”crossref“，”unstructured“：”W.E.Larimore“。识别、滤波和自适应控制中的典型变量分析。程序中。第29届IEEE决策与控制会议，第596\u2013604页，夏威夷火奴鲁鲁，1990年12月。米切尔。用隐藏状态强化学习。程序中。第二届自适应行为模拟国际会议：从动物到动画2.，第271\u20132801992页。“，”DOI“：”10.7551\/mitpress\/3116.003.038“}，{“key”：“5_CR9”，“DOI-asserted-by”：“crossref”，“unstructured”：“M.L。利特曼。马尔可夫博弈作为多智能体强化学习的框架。程序中。第11届国际机器学习会议，第157\u2013163页，1994年。“，”DOI“：”10.1016\/B978-1-55860-335-6.50027-1“}，{”key“：”5_CR10“，”first page“：“199”，“volume”：“21”，”author“：”A.W.Moore“，”year“：”1995“，”unstructured“：”A.W.Moole和C.G。阿特克森。多维状态空间中可变分辨率强化学习的parti-game算法。机器学习，21:199\u20132331995。“，“journal-title”：“机器学习”}，{“key”：“5_CR11”，“doi-asserted-by”：“crossref”，“unstructured”：“T.W.Sandholm和R.H.Crites.论半竞争领域中的多智能体Q-学习。多智能体系统适应和学习研讨会笔记，IJCAI-951995。”，“doi”：“10.1007\/3-540-60923-7_28“}，{“key”：“5_CR12”，“unstructured”：“P.Stone and M.Veloso.Using machine learning in the soccer server.in Proc.of IROS-96 Workshop on Robocup，1996.”}，“key“：”5_CR13“，”doi-asserted-by“：”crossref“，”unstructure“：”E.Uchibe，M.Asada，and K。细田章男。使用模块化强化学习的移动机器人行为协调。程序中。1996年IEEE RSJ智能机器人和系统国际会议，第1329\u20131336页，1996年。“，”DOI“：”10.1109\/IROS.1996.568989“}，{“key”：“5_CR14”，“DOI-asserted-by”：“crossref”，“unstructured”：“E.Uchibe，M.Asada，and K。细田章男。基于视觉的学习型移动机器人环境复杂性控制。程序中。IEEE机器人与自动化国际会议，1998年（即将推出）。“，”DOI“：”10.1109\/ROBOT.1998.680514“}，{”issue“：”12“，”key“：”5_CR15“，”DOI-asserted-by“：”publisher“，”first page“：“1853”，”DOI:“10.1016\/0005-1098（95）00072-0”，“volume”：“31”，“author”：“P.Overschee-Van”，“year”：“1995”，“unstructured”：”P.Van Overschee和B.De Moor。三个子空间系统识别算法的统一定理。Automatica，31（12）：1853\u201318641995.“，”journal-title“：”Automatica“}，{“key”：“5_CR16”，“doi-asserted-by”：“crossref”，“unstructured”：“C.J.C.H.Watkins和P.Dayan.技术说明：Q-learning。机器学习，第279\u20132921992.”，“doi”：“10.1007\/BF00992698”}]，“container-title”：[“学习机器人”，“计算机科学讲义”]，“原始标题”：[]，“link“：[{”URL“：”http://\/link.springer.com/content\/pdf\/10.1007\/3-540-49240-2_5“，”content-type“：”unspecified“，”content-version“：”vor“，”intended-application“：”similarity-checking“}]，”deposed“：{”date-parts“：[2024,2,18]]，”date-time“：“2024-02-18T23:31:05Z”，“timestamp”：170829906500}，“score”：1，“resource”：{“primary”：{“URL”：“http://\/link.springer.com/10.1007\/3-540-49240-2_5“}}，”副标题“：[]，”短标题“：[]，”已发布“：{”日期部分“：[[1998]]}，“ISBN”：[“9783540654803”，“97835492405”]，”引用计数“：16，”URL“：”http://\/dx.doi.org\/10.10007\/3-504-49240-2_5 2-9743“]，”ISSN-type“：[{”value“：”0302-9743“，”type“:”print“}]，”subject“：[]，”published“：{”日期部分“：[1998]}}