海报 在上共享 自主机器人中具有非静态相关性的多任务学习作者:亚历杭德罗 罗梅罗,詹卢卡 巴尔达萨雷,理查德·J。 杜罗牌手表、和维埃里·朱利安诺 圣图奇作者信息和声明AAMAS’23:2023年自治代理和多代理系统国际会议记录2023年5月页2547-2549出版:2023年5月30日 出版历史 获取引文提醒新增引文提醒!此警报已成功添加,将发送到:只要您选择的记录被引用,您就会收到通知。新引文提醒!拜托登录到您的帐户 获取访问权限目录AAMAS’23:2023年自治代理和多代理系统国际会议记录自主机器人中具有非静态相关性的多任务学习页2547-2549以前的文章通过利他多智能体强化学习学习自由形式模块化机器人的自我重构上一个下一篇文章基于图论的可操作三维结构下一步摘要工具书类信息和贡献者文献计量学和引文获取访问权限工具书类媒体桌子分享摘要自主开放式学习领域的一个重要挑战是对相互依存任务的自主学习,特别是当这种相互依存关系是非平稳的时,机器人必须修改所获得的知识,以正确排列构成其他目标前提的目标。这项工作提出了一种分层机器人体系结构来解决这类场景,允许自主学习实现多个目标所需的技能,以及反映它们之间关系的序列。此外,我们的系统被赋予了一种机制,在自我评估能力超过目标实现的基础上,能够自我调整勘探与开发平衡,以应对环境的非国家性。该体系结构使用UR5e机器人进行了测试,该机器人在一个场景中应该自主学习完成各种操作任务。工具书类[1]Gianluca Baldassarre和Marco Mirolli。2013.自然和人工系统中的内在动机学习。斯普林格。谷歌学者[2]阿德里安·巴拉恩斯(Adrien Baranes)和皮埃尔·伊夫·奥德耶(Pierre-Yves Oudeyer)。2013年,主动学习机器人中具有内在动机的目标探索逆模型。机器人与自治系统61,1(2013),49--73。数字图书馆谷歌学者[3]安德鲁·巴托(Andrew G Barto)、萨丁德·辛格(Satinder Singh)和纳塔蓬·陈塔内兹(Nuttapong Chentanez)。2004年,内在动机学习分层技能集合。第三届发展与学习国际会议记录。112--19.谷歌学者[4]Cédric Colas、Pierre Fournier、Mohamed Chetouani、Olivier Sigaud和Pierre-Yves Oudeyer。2019.好奇:内在激励的模块化多目标强化学习。在机器学习国际会议上。PMLR,1331-1340年。谷歌学者[5]Cédric Colas、Tristan Karch、Olivier Sigaud和Pierre-Yves Oudeyer。2022.具有内在动机目标条件强化学习的金图腾特工:一项简短调查。《人工智能研究杂志》74(2022),1159--1199。数字图书馆谷歌学者[6]穆罕默德·伯汉·哈菲兹(Muhammad Burhan Hafez)和斯特凡·维尔姆特(Stefan Wermter)。2021.行为自组织支持机器人持续学习的任务推断。2021年IEEE/RSJ智能机器人与系统国际会议(IROS)。IEEE,6739--6746。谷歌学者[7]亚历山大·克鲁宾(Alexander S Klyubin)、丹尼尔·波拉尼(Daniel Polani)和克里斯托弗·莱哈尼夫(Chrystopher L Nehaniv)。2008年。让你的选择保持开放:基于信息的传感运动系统驱动原理。公共科学图书馆one 3,12(2008),e4018。交叉参考谷歌学者[8]约翰·朗斯(John Lones)、马修·刘易斯(Matthew Lewis)和洛拉·卡纳梅罗(Lola Cañamero)。2016.从感觉运动经验到认知发展:调查经验多样性对表观遗传机器人发展的影响。机器人与AI前沿3(2016),44。交叉参考谷歌学者[9]马洛斯·马查多(Marlos C Machado)、马克·贝勒马尔(Marc G Bellemare)和迈克尔·鲍林(Michael Bowling)。2017年,强化学习中选项发现的拉普拉斯框架。在机器学习国际会议上。PMLR,2295-2304。谷歌学者[10]Pierre Yves Oudeyer、Frdric Kaplan和Verena V Hafner。2007.用于自主智力发展的内在激励系统。IEEE进化计算事务11,2(2007),265--286。谷歌学者[11]亚历杭德罗·罗梅罗、吉安卢卡·巴尔达萨雷、理查德·杜罗和维埃里·朱利亚诺·桑图奇。2021.分析机器人中具有不同相互依赖子目标的自主开放式技能学习。2021年,第20届国际先进机器人会议(ICAR)。IEEE,646--651。交叉参考谷歌学者[12]A.Romero、F.Bellas、A.Prieto和R.J.Duro。2018年,认知机器人激励系统中效用模型的重新描述。2018年IEEE/RSJ国际智能机器人与系统会议(IROS)。2324--2329. https://doi.org/10.109/IROS.2018.8593799数字图书馆谷歌学者[13]亚历杭德罗·罗梅罗(Alejandro Romero)、亚伯拉罕·普列托(Abraham Prieto)、弗朗西斯科·贝拉斯(Francisco Bellas)和理查德·杜罗(Richard J Duro)。2019.简化认知机器人连续领域实用模型的创建和管理。神经计算353(2019),106-118。数字图书馆谷歌学者[14]维埃里·朱利亚诺·桑图奇(Vieri Giuliano Santucci)、吉安卢卡·巴尔达萨雷(Gianluca Baldassarre)和埃米利奥·卡尔塔尼(Emilio Cartoni)。2019.多个相关任务的自动强化学习。2019年,IEEE第九届开发、学习和表观遗传机器人联合国际会议(ICDL-EpiRob)。IEEE,221--227。交叉参考谷歌学者[15]维埃里·朱利亚诺·桑图奇(Vieri Giuliano Santucci)、吉安卢卡·巴尔达萨雷(Gianluca Baldassarre)和马可·米罗利(Marco Mirolli)。2013.学习多种技能的最佳内在动机信号是什么?神经机器人学前沿7(2013),22。谷歌学者[16]维埃里·朱利亚诺·桑图奇(Vieri Giuliano Santucci)、吉安卢卡·巴尔达萨雷(Gianluca Baldassarre)和马可·米罗利(Marco Mirolli)。2016年,圣杯:一种用于内在动机学习的目标发现机器人架构。IEEE认知与发展系统汇刊8,3(2016),214--231。交叉参考谷歌学者[17]维埃里·朱利亚诺·桑图奇(Vieri Giuliano Santucci)、戴维德·蒙特拉(Davide Montella)和吉安卢卡·巴尔达萨雷(Gianluca Baldassarre)。2022.C-GRAIL:多个上下文相关目标的自主强化学习。IEEE认知与发展系统汇刊(2022)。谷歌学者 引用人查看全部吴X东-西赖H于Y文Y(2023)执行器退化情况下四足机器人的自适应控制策略第五届分布式人工智能国际会议论文集10.1145/3627676.3627686(1-13)在线发布日期:2023年11月30日https://dl.acm.org/doi/10.1145/3627676.3627686 索引术语 自主机器人中具有非静态相关性的多任务学习计算方法人工智能知识表示和推理认知机器人机器学习学习范式强化学习 建议 具有内在动机的机器人目标探索逆模型的主动学习 我们引入了自适应目标生成鲁棒智能自适应好奇(SAGG-RIAC)体系结构,作为一种内在激励的目标探索机制,允许在高维冗余机器人中主动学习逆模型。。。阅读更多信息自主机器人的发展学习 发展机器人学关注算法的设计,通过行为的定性增长和能力水平的提高来促进机器人的适应和学习。本文运用了早期婴儿心理学(。。。阅读更多信息自主移动机器人导航系统的设计与实现 本文提出了一种用于自主移动机器人的导航系统。我们的导航系统是基于行为和基于模型的导航系统的混合体。在我们的系统中,基于行为的子系统负责低级反应行动。。。阅读更多信息 评论 Please enable JavaScript to view thecomments powered by Disqus. 信息和贡献者问询处发布于 AAMAS’23:2023年自治代理和多代理系统国际会议记录2023年5月3131页国际标准图书编号:9781450394321总主席:诺亚·阿格蒙以色列巴伊兰大学,保安新加坡南洋理工大学,课程主席:亚历山德罗·里奇意大利博洛尼亚大学,杨致远(William Yeoh)美国圣路易斯华盛顿大学 赞助商SIGAI:ACM人工智能特别兴趣小组国际会计师联合会出版商国际自治代理和多代理系统基金会南卡罗来纳州里奇兰出版历史出版:2023年5月30日检查更新作者标记认知控制体系结构发育机器人机器人控制的机器学习限定符海报资金来源西班牙MCIU/FEDER地平线欧洲欧盟地平线2020研究与创新计划加利西亚勋塔加利西亚调查中心会议AAMAS’23年赞助商:SIGAI公司AAMAS’23:自治代理和多代理系统国际会议2023年5月29日至6月2日英国伦敦 接受率5036份提交文件中的1155份总体接受率,23% 贡献者 其他指标查看文章指标文献计量学和引文文献计量学 文章指标 1引文总数查看引文22总下载次数下载量(最近12个月)15下载次数(最近6周)1 其他指标查看作者指标引文 引用人查看全部吴X东-西赖H于Y文Y(2023)执行器退化情况下四足机器人的自适应控制策略第五届分布式人工智能国际会议论文集10.1145/3627676.3627686(1-13)在线发布日期:2023年11月30日https://dl.acm.org/doi/10.1145/3627676.3627686 视图选项获取访问权限 登录选项检查您是否可以通过登录凭据或您的机构访问本文。登录完全访问权限获取此出版物 查看选项 PDF格式以PDF文件查看或下载。PDF格式 电子阅读器使用联机查看电子阅读器.电子阅读器媒体数字其他桌子分享分享共享此出版物链接复制链接已复制!复制失败。在社交媒体上分享Linkedin公司重新编辑电子邮件附属公司亚历杭德罗 罗梅罗西班牙科鲁尼亚达科鲁尼亚大学https://orcid.org/0000-0002-0507-8320查看个人资料詹卢卡 巴尔达萨雷意大利罗马国家研究委员会https://orcid.org/0000-0002-1277-4447查看个人资料理查德·J。 杜罗牌手表西班牙科鲁尼亚达科鲁尼亚大学https://orcid.org/0000-0002-6807-524X查看个人资料维埃里·朱利亚诺 圣图奇意大利罗马国家研究委员会https://orcid.org/0000-0002-8748-9632查看个人资料