×

机器人导航作为分层主动推理。 (英语) Zbl 1521.68222号

摘要:定位和地图绘制是一个长期的研究领域,无论是在神经科学领域,还是在机器人领域,都是为了了解哺乳动物如何在环境中导航,从而实现自主移动机器人。在本文中,我们将导航视为在层次生成模型下最小化(期望)变化自由能的推理行为。我们发现,感知、路径整合、定位和映射等熟悉的概念自然地从这个主动推理公式中浮现出来。此外,我们还表明,该模型与海马功能模型是一致的,并且可以在真实的机器人上以电子方式实现。我们的实验表明,装备了我们的层次模型的机器人能够生成拓扑一致的地图,并且当向系统提供目标位置时,可以推断出正确的导航行为。

MSC公司:

68T40型 机器人人工智能
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] 巴尔达萨诺,C。;哈森,美国。;Norman,K.A.,叙事感知中真实世界事件图式的表征,《神经科学杂志》,38,45,9689-9699(2018)
[2] 鲍尔·D。;希思,S。;Wiles,J。;惠氏,G。;科克,P。;Milford,M.,OpenRatSLAM:一个开源的基于大脑的SLAM系统,Autonomous Robots,34,1-28(2013)
[3] Beal,J.M.,近似贝叶斯推断的变分算法(2003)
[4] Buzsáki,G。;Tingley,D.,《空间与时间:海马作为序列发生器》,《认知科学趋势》,22853-869(2018)
[5] 凯德纳,C。;Carlone,L。;卡里略,H。;拉蒂夫,Y。;斯卡拉穆扎,D。;Neira,J.,《同步定位和绘图的过去、现在和未来:迈向鲁棒感知时代》,《机器人学报》,32,6,1309-1332(2016)
[6] 圣母玛利亚,O。;瓦提尔,S。;De Boom,C。;Verbelen,T。;Dhoedt,B.,主动推理的学习生成状态空间模型,计算神经科学前沿,14,103(2020)
[7] 圣母玛利亚,O。;Jansen,W。;Verbelen,T。;Dhoedt,B。;Steckel,J.,Latentslam:定位和绘图的无监督多传感器表示学习,(2021年机器人与自动化国际会议(ICRA)(2021)),(新闻稿)
[8] 圣母玛利亚,O。;Wauthier,S。;Verbelen,T。;吊杆,C.D。;Dhoedt,B.,《自主机器人导航的深度主动推理》,(架桥人工智能与认知科学(BAICS)研讨会,ICLR(2020))
[9] 克劳森,W。;F.Vicente,A。;Ferraris,M。;伯纳德,C。;巴塔利亚,D。;Quilichini,P.,《海马体和皮层的计算中心》,《科学进展》,第5期(2019年)
[10] 科内尔·D·S。;Gerstner,W.,《吸引子网络动力学在迷宫式环境中实现预演和快速路径规划》,(Cortes,C.;Lawrence,N.;Lee,D.;Sugiyama,M.;Garnett,R.,《神经信息处理系统的进展》,第28卷(2015)),1684-1692
[11] Dannenberg,H.、Lazaro,H.,Nambiar,P.、Hoyland,A.和Hasselmo,M.E.。视觉输入对内侧内嗅皮层位置编码和跑步速度的神经动力学的影响。电子生活,962500。http://dx.doi.org/10.7554/eLife.62500。
[12] Duan,C。;Junginger,S。;黄,J。;Jin,K。;Thurow,K.,运输机器人视觉SLAM的深度学习:综述,运输安全与环境,1,3177-184(2020)
[13] 埃普,M。;Gumbsch,C。;克泽尔,M。;Nguyen,P.D.H。;布茨,M.V。;Wermter,S.,《具体强化学习的层次原则:综述》(2020年),arXiv:2012.10147
[14] 范伯格,T。;Mallatt,J.,《5亿年前寒武纪时期意识的进化和遗传起源》,《心理学前沿》,4667(2013),网址https://www.frontiersin.org/article/10.3389/fpsyg.2013.00667
[15] 新泽西州福廷。;Agster,K.L。;Eichenbaum,H.B.,海马体在事件序列记忆中的关键作用,自然神经科学,5458-462(2002)
[16] Friston,K.,《自由能量原理:统一的大脑理论?》?,《自然评论神经科学》,11,2,127-138(2010)
[17] Friston,K.J.,《我们所知道的生活》,《皇家学会界面杂志》(2013)
[18] Friston,K。;Da Costa,L。;哈夫纳,D。;Hesp,C。;Parr,T.,《复杂推理》(2020年)
[19] Friston,K。;Kilner,J。;Harrison,L.,《大脑的自由能原理》,《生理学杂志》(巴黎),100,1-3,70-87(2006)
[20] Friston,K。;萨莫特拉基斯,S。;Montague,R.,《主动推理与代理:无成本函数的最优控制》,《生物控制论》,106,8,523-541(2012)·Zbl 1267.90167号
[21] Gray,J.A.,(《焦虑的神经心理学:对隔-海马系统功能的探讨》,《焦虑的神经心理学:对间隔-海马系统的功能的探索》,牛津心理学丛书,第33卷(2000年),牛津大学出版社:牛津大学出版社,牛津[英格兰])
[22] Griffiths,B。;G·帕里什。;鲁克斯,F。;米歇尔曼,S。;普拉斯,M。;Kolibius,L.,人类情景记忆中快速和缓慢海马γ与新皮质α/β振荡的定向耦合(2019年)
[23] Guanella,A。;Kiper,D。;Verschure,P.,基于扭曲圆环拓扑的网格单元模型,国际神经系统杂志,17,231-240(2007)
[24] 哈,D。;Schmidhuber,J.,《递归世界模型促进政策演变》,(神经信息处理系统进展31(2018),Curran Associates,Inc.),2451-2463,https://worldmodels.github.io。统一资源定位地址https://papers.nips.cc/paper/7512-recurrent-world-models-facilitate-policy-evolution网站
[25] 哈夫纳,D。;Lillicrap,T.公司。;费舍尔,I。;维莱加斯,R。;Ha,D。;Lee,H.,《从像素学习规划的潜在动力》(2018),arXiv预印本arXiv:1811.04551
[26] Hafting,T。;费恩,M。;莫尔登,S。;莫瑟,M.-B。;Moser,E.I.,内嗅皮层空间地图的微观结构,《自然》,436801-806(2005)
[27] 霍金斯,J。;Blakeslee,S.,《论情报》(2004),《时代图书:美国时代图书》
[28] Hochreiter,S。;Schmidhuber,J.,《长短期记忆,神经计算》,第9、8、1735-1780页(1997年)
[29] 霍夫曼,K。;Dragan,M。;Leonard,T。;Micheli,C。;蒙特福斯科·西格蒙德,R。;Valiante,T.,《视觉探索期间的扫视使人类和非人类灵长类动物的海马3-8赫兹节律对齐》,《系统神经科学前沿》,第7期,第43页(2013年)
[30] Honkanen,A.,Adden,A.、da S.Freitas,J.和Heinze,S.昆虫中枢复合体和导航策略的神经基础。实验生物学杂志,增刊1,http://dx.doi.org/10.1242/jeb.188854。
[31] 伊加塔,H。;Y.Ikegaya。;Sasaki,T.,《海马学习预测图上的优先经验回放》,《国家科学院院刊》,118(2021)
[32] 约翰逊,A。;Redish,A.,CA3中的神经系统在决定点瞬时编码动物前进的路径,《神经科学杂志:神经科学学会官方杂志》,27,12176-12189(2007)
[33] 约翰逊,A。;Z·瓦伯格。;Benhardus,J。;Maahs,A。;Schrater,P.,《海马体与探索:动态进化行为和神经表征》,《人类神经科学前沿》,6216(2012)
[34] 卡普兰,R。;Friston,K.,《规划和导航作为主动推理》,《生物控制论》,第112、7页(2018年)·Zbl 1400.92607号
[35] Karimi Abadchi,J。;Nazari-Ahangarkolee,M。;加塔斯,S。;Bermudez Contreras,E。;Luczak,A。;Mcnaughton,B.,海马锐波涟漪周围新皮质活动的时空模式,eLife,9(2020)
[36] 凯·K。;钟,J。;索萨,M。;Schor,J.等人。;卡尔森,M。;Larkin,M.,《海马体中可能的未来表征之间的持续亚秒循环》,《细胞》,180(2020)
[37] Kiebel,S.J。;Daunizeau,J。;Friston,K.J.,感知和层次动力学,神经信息学前沿,3(2009)·Zbl 1229.62027号
[38] Kikumoto,A。;Mayr,U.,解码振荡脑电图活动中顺序行为的分层控制,eLife,7(2018)
[39] Kingma,D.P。;Ba,J.,Adam:随机优化方法,(Bengio,Y.;LeCun,Y.,第三届学习表征国际会议,ICLR 2015,美国加利福尼亚州圣地亚哥,2015年5月7日至9日,会议跟踪记录(2015))
[40] Kingma,D.P。;Welling,M.,自动编码变分贝叶斯(2013),CoRR abs/1312.6114
[41] Knierim,J。;Zhang,K.,边缘系统空间相关神经活动的吸引子动力学,《神经科学年度评论》,35,267-285(2012)
[42] K.奈特,《航海:从动物行为到指导原则》,《鱼类生物学杂志》,222(2019)
[43] 拉贝,M。;Michaud,F.,RTAB-map,作为一个开源激光雷达和可视同步定位与绘图库,用于大规模和长期在线操作,《野外机器人杂志》,36,2,416-446(2019)
[44] 劳巴赫,M。;苋菜,L。;卡塔诺,M。;Horst,N.,啮齿动物内侧额叶皮层的奖励信号,(2020年)
[45] Lee,A.、Hoy,J.、Bonci,A.、Wilbrecht,L.、Stryker,M.和Niell,C.M.与运动平行调节视觉皮层状态的脑干回路的识别。神经元,2455-466。http://dx.doi.org/10.1016/j.neuron.2014.06.031。
[46] Li,R。;王,S。;长,Z。;Gu,D.,UnDeepVO:通过无监督的深度学习进行单目视觉里程测定,(2018 IEEE机器人与自动化国际会议(ICRA)(2018)),7286-7291
[47] 麦克,M。;Preston,A。;Love,B.,《概念学习期间腹内侧前额叶皮层受压》,《自然通信》(2020年)
[48] Marghi,Y.、Towhidhkhah,F.和Gharibzadeh,S.《路径规划中的人脑功能:任务研究》。认知计算。
[49] 梅列霍夫,I。;Ylioinas,J。;坎纳拉,J。;Rahtu,E.,使用卷积神经网络进行相对相机姿态估计,(Blanc-Talon,J.;Penne,R.;Philips,W.;Popescu,D.;Schenders,P.,《智能视觉系统的先进概念》(2017),675-687
[50] Milford,M.、Prasser,D.和Wyeth,G.(2005)。经验映射:使用RatSLAM生成空间连续的环境表示。在2005年澳大利亚机器人与自动化会议论文集中,ACRA 2005。
[51] 米尔福德,M。;Wyeth,G.,《使用生物启发的SLAM系统进行持续导航和绘图》,《国际机器人研究杂志》,29,9,1131-1153(2010),arXiv:https://doi.org/10.1177/0278364909340592
[52] 米尔福德,M.J。;惠氏集团。;Prasser,D.,RatSLAM:用于同步定位和绘图的海马模型(IEEE机器人和自动化国际会议,2004年)。诉讼程序。2004年ICRA。2004年,第1卷(2004)),403-408
[53] Millidge,B.,《作为变化政策梯度的深度主动推理》,《数学心理学杂志》,96,第102348页,(2020年)·Zbl 1448.91236号
[54] Mirza,M.B。;亚当斯,R.A。;数学博士。;Friston,K.J.,场景构建、视觉觅食和主动推理,计算神经科学前沿,10,56(2016)
[55] 奥基夫,J。;Nadel,L.,《海马体作为认知地图》(1978年),克拉伦登出版社:牛津克拉伦登出版公司
[56] 帕拉斯坎多洛,G。;Buesing,L。;梅雷尔,J。;哈森克韦尔,L。;Aslanides,J。;Hamrick,J.B.,《目标导向规划的分而治之蒙特卡罗树搜索》(2020),arXiv:2004.11410
[57] 帕尔,T。;Friston,K.J.,《离散和连续的大脑:从决策到行动再回来》,《神经计算》,30,9,2319-2347(2018)·Zbl 1472.92035号
[58] 佩尔,M。;英国布鲁内克。;新南威尔士州纽科姆。;爱泼斯坦,R.A.,用认知地图和认知图形构建知识,《认知科学趋势》,25,1,37-54(2021)
[59] Pio-Lopez,L。;Nizard,A。;Friston,K。;佩祖洛,G。;Pio-Lopez,L。;Nizard,A.,《主动推理和机器人控制:案例研究》,《皇家学会杂志》,《界面》,第13期,第122页(2016年)
[60] Rezende,D.J.、Mohamed,S.和Wierstra,D.(2014)。深度生成模型中的随机反向传播和近似推理。第31届国际机器学习会议(ICML)论文集,第32卷(第1278-1286页)。
[61] Rikhye,R.V。;哥多斯卡,北。;Guntupalli,J.S。;Dedieu,A。;Lázaro-Gredilla,M。;George,D.,学习认知地图作为替代评估的结构化图,bioRxiv(2020)
[62] Sarel,A.、Finkelstein,A.和Las,L.N.蝙蝠海马体中空间目标的矢量表示。《科学》,6321176-180。http://dx.doi.org/10.1126/science.aak9589。
[63] 施瓦滕贝克,P。;帕斯克,J。;豪泽,T.U。;菲茨杰拉德,T.H。;克伦比克勒,M。;Friston,K.J。;Frank,M.J.,《好奇和目标导向探索的计算机制》,eLife,8,Article e41703 pp.(2019)
[64] 沙纳汉,M。;Baars,B.,《将全球工作空间理论应用于框架问题》,《认知》,98,157-176(2006)
[65] Shang,W。;Trott,A。;郑S。;熊,C。;Socher,R.,《加速分层强化学习的学习世界图》(Learning world graphs to accelerated hierarchical reinforcement Learning)(2019年),arXiv:1907.00664
[66] 施,X。;李,D。;赵,P。;田强。;田,Y。;朗,Q,我们准备好服务机器人了吗?终身SLAM的openloris-scene数据集,(2020年IEEE机器人与自动化国际会议(ICRA)(2020年)),3139-3145
[67] 西尔维拉。;Guth,F。;Drews-Jr,P。;Ballester,P。;马查多,M。;Codevilla,F.,《水下SLAM的开放源代码生物灵感解决方案》(第四届IFAC水下航行器导航、制导和控制研讨会NGCUV 2015(2015))
[68] 史密斯,R。;赛尔夫,M。;Cheeseman,P.,估算机器人中的不确定空间关系,(1(1986)),435-461·Zbl 0645.70003号
[69] Stachenfeld,K.L。;Botvinick,M.M。;Gershman,S.J.,《海马体作为预测图》,《自然神经科学》,20171643-1653(2017),(2017)
[70] Steckel,J。;Peremans,H.,BatSLAM:使用仿生声纳进行同步定位和绘图,PLOS ONE,8,1,1-11(2013)
[71] 斯特雷德,G.大脑进化原理。第1版,西诺协会是马萨诸塞州桑德兰牛津大学出版社的印记。
[72] Suryanarayana,S.M。;佩雷斯·费尔南德斯,J。;Robertson,B。;Grillner,S.,《脊椎动物大脑皮层视觉和体感表征的进化起源》,《自然生态与进化》,4639-651(2020)
[73] 特隆,S。;伯加德,W。;Fox,D.(概率机器人。概率机器人、智能机器人和自主代理(2005),麻省理工学院出版社)·兹比尔1081.68703
[74] 特鲁利尔,O。;维纳,S.I。;Berthoz,A。;Meyer,J.A.,《基于生物的人工导航系统回顾与展望》,《神经生物学进展》,51,5,483-544(1997),网址https://www.sciencedirect.com/science/article/pii/S0301008296000603
[75] Tschantz,A。;巴尔蒂埃里,M。;Seth,A.K。;Buckley,C.L.,缩放主动推断(2019),ArXiv电子打印ArXiv:1911.10601
[76] Tschantz,A。;米利奇,B。;Seth,A.K。;Buckley,C.L.,《通过主动推理强化学习》,(人工智能与认知科学(BAICS)研讨会,ICLR(2020))
[77] 尤里亚,B。;伊巴兹,B。;巴尼诺,A。;赞巴尔迪,V。;库马兰,D。;Hassabis,D.,《空间记忆管道:哺乳动物大脑中自我中心到异体中心理解的模型》,bioRxiv(2020)
[78] 范德哈姆,I。;克莱森,M。;埃弗斯,A。;van der Kuil,M.,《人类一生导航能力的大规模评估》,《科学报告》,第103299页(2020年)
[79] 王建新。;Kurth-Nelson,Z。;库马兰,D。;蒂鲁马拉,D。;Soyer,H。;Leibo,J.Z.,作为元强化学习系统的前额叶皮层,《自然神经科学》,21860-868(2018)
[80] J.C.惠廷顿。;穆勒,T.H。;马克·S。;陈,G。;巴里,C。;伯吉斯,N.,《托尔曼-伊肯鲍姆机器:通过海马结构的泛化统一空间和关系记忆》,《细胞》,183,5,1249-1263(2020),e23
[81] 维纳,J。;埃鲍尔,N。;Mallot,H.,《多目标规划路径:空间问题解决中的记忆参与和规划启发》,《心理学研究》,73644(2009)
[82] 杨,F。;Jin,B.,SLAM概述,(全球情报产业大会(GIIC 2018),第10835卷(2018)),214-219
[83] Zador,A.M.,《对纯粹学习和人工神经网络可以从动物大脑学习什么的批判》,《自然通讯》,第103770页(2019年)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。