{“状态”:“确定”,“消息类型”:“工作”,“信息版本”:“1.0.0”,“邮件”:{“索引”:{“日期-部分”:[[2022,11,20]],“日期-时间”:“2022-11-20T05:51:36Z”,“时间戳”:1668923496938},“参考-计数”:19,“出版商”:“富士科技出版社”,“问题”:“6”,“资助者”:[{“DOI”:“10.13039\/501000004826”,”“名称”:“自然科学基金会北京市”,“doi-asserted-by”:“publisher”,“award”:[“4202022”,“4212035”,“4204096”]}:“北京市教委科研项目”,“奖项”:[“KM202010009006”,“201910009008”]}],“内容域”:{“域”:[],“交叉标记-限制”:false},“短容器-时间”:[”JACIII“,”J.Adv.Compute.Intell.Intell.Inform.“],“published-print“:{”date-parts“:[2022,11,20]},”abstract“:”外部奖励在强化学习过程中起着重要作用,其设计的质量决定了算法的最终效果。然而,在几个真实世界的场景中,对代理来说,外部奖励是极其稀少的。这在移动机器人导航中尤为明显。为了解决这个问题,本文提出了一种基于好奇心的自主导航算法,该算法由强化学习框架和好奇心系统组成。好奇心系统由三部分组成:预测网络、联想记忆网络和好奇心奖励。预测网络预测下一个状态。联想记忆网络被用来代表世界。基于联想记忆网络,设计了推理算法和距离标定算法。好奇心奖励与外部奖励相结合,作为Q-学习算法的补充输入。仿真结果表明,该算法有助于agent减少在自主导航过程中对环境的重复探索。该算法也具有较好的收敛效果<\/jats:p>“,”DOI“:”10.20965\/jacii.2022.p0893“,”type“:”journal-article“,”created“:{”date-parts“:[2022,11,19]],”date-time“:”2022-11-19T15:02:05Z“,”timestamp“:166887012500},”page“:“893-904”,“source”:“Crossref”,“is-referenced-by-count”:0,“title”:[“迷宫机器人基于好奇的自主导航算法”],“前缀”:“10.20965“,”卷“:”26“,”作者“:[{”给定“:”小平“,”家庭“:”张“,”序列“:”第一“,”隶属关系“:[]},{”名称“:”华北工业大学电气与控制工程学院,中国北京市石景山区金元庄路5号,100144,“sequence”:“first”,“affiliation”:[]neneneep,{“给定”:“一号”,“家庭”:“刘”,“segment”:“additional”,“affiliation“:[]},{“给定”:“Li”,“family”:“Wang”,“sequence”:“additional”,“affiliance”:[]{“given”:“Dunli”,“家庭”:“Hu”,”sequence“:”additional“,”affiliation:[]}.,{”given“:”Lei“,”family“:”Liu“,”segment“:”additional“”,“filiation”:[]},“member”:“8550”,“published on”:{“date-parts”:[2022,11,20]]},“引用”:[{“键”:“key-10.20965 \/jacii.2022.p0893-1“,”doi-asserted-by“:”crossref“,”unstructured“:”I.Sugiarto,L.L.U.Tung,and M.I.Rahman,“基于超声波测距的移动机器人迷宫跟踪的FPGA中模糊逻辑的实现”,Jurnal Teknik Elektro,第8卷,第2期,第96-102页,2008年。“,”doi“:”10.9744 \/jte.8.2.96-102“},{“key”:“key-10.20965,jacii.2022.p0893-2“,”doi-asserted-by“:”crossref“,”unstructured“:”R.Kumar,P.Jitoko,S.Kumar“,K.Pillay,P.Prakash,A.Sagar,R.Singh,and U.Mehta“,带自动避障的迷宫解决机器人,《Procedia Computer Science》,第105卷,第57-61页,2017年。“,”doi“:”10.1016“/j.procs.2017.01.192”},{“key”:“”key-10.20965 \/jacii.2022.p0893-3“,”doi-asserted-by“:”crossref“,”unstructured“:”S.V.Burtsev和Y.P.Kuzmin,\u201cAn efficient flood filling algorithm,《计算机与图形》,第17卷,第5期,第549-561页,1993年。“,”doi“:”10.1016\/0097-8493(93)90006-U“非结构化”:“H。Dang,J.Song和Q.Guo,《机器人迷宫求解的有效算法》,2010年第二届智能人机系统与控制论国际会议,第79-82页,2010年。“,“DOI”:“10.1109”,{“key”:“key-10.20965”,“DOI-asserted-by”:“crossref”,“unstructured”:“M.O.A.Aqel,A.Issa,M.Khdair,M。Elhabbash,M.AbuBaker和M.Massoud,基于图像处理和图论算法的智能迷宫解决机器人,2017年国际会议,第48-53页,2017年。“,“DOI”:“10.1109”,{“key”:“key-10.20965”,“jacii.2022.p0893-6”,“DOI-asserted-by”:“crossref”,“unstructured”:“T。Mannucci和E.-J.v.Kampen,带有强化学习和映射的分层迷宫导航算法,2016 IEEE Symp。计算智能系列(SSCI),doi:10.1109,SSCI.2016.7849365,2016.“,”doi“:”10.1109,“SSCI.2016.7849365”},{“key”:“key-10.20965”,jacii.2022.p0893-7“,”doi-asserted-by“:”crossref“,“unstructured”:“S.H.Han,H.J.Choi,P.Benz,and J。Loaiciga,通过深度强化学习实现基于传感器的移动机器人导航,2018年IEEE大数据和智能计算国际会议(BigComp),第147-154页,2018年。Burgard,\u201cCuriosity-driven exploration for mapless navigation with deep reinforcement learning,\u201 D arXiv:1804.00456,2018。“},{“key”:“key-10.20965”,jacii.2022.p0893-9“,”doi-asserted-by“:”crossref“,“unstructured”:“D.Pathak,P.Agrawal,A.A.Efros,and T。Darrell,通过自我监督预测进行好奇驱动的探索,2017 IEEE计算机视觉和模式识别研讨会(CVPRW),第488-489页,2017年。“,“DOI”:“10.1109”,“CVPRW.2017.70”},{“key”:“key-10.20965”,jacii.2022.p0893-10”,“非结构化”:“V.Mnih,A.P.Badia,M.Mirza,A.Graves,T.Lillicrap,T.Harley,D。Silver和K.Kavukcuoglu,深度强化学习的异步方法。第33届国际机器学习大会,第48卷,第1928-1937页,2016年。Hwang,\u201cEnd-to-End Navigation Strategy with Deep Reinforction Learning for Mobile Robots,\u201 d IEEE Trans.(移动机器人深度强化学习端到端导航策略)。关于工业信息学,第16卷,第4期,第2393-24022020.”,“DOI”:“10.1109\/TII.20192936167”},{“key”:“key-10.20965\/jacii.202.p0893-12”,“DOI断言”:“crossref”,“非结构化”:“P.-Y.Oudeyer,\u201c好奇心驱动学习的计算理论,\u201d arXiv:1802.105462018.”,“DOI”:“10.31234\/osf.io\/3p8f6”},{“key”:“key-10.20965,jacii.2022.p0893-13,“doi-asserted-by”:“crossref”,“unstructured”:“E.Law,P.-Y.Oudeyer,M.Yin,M.Schaekermann,and A.C.Williams,《好奇设计:跨学科研讨会》,《201d Proc》。2017年CHI Conf.计算机系统人为因素扩展摘要,第586-592页,2017年。Hafner,\u201c自主心理发展的内在动机系统,\u201d IEEE Trans。《进化计算》,第11卷,第2期,第265-286页,2007年。“,“DOI”:“10.1109\/TEVC.2006.890271”},{“key”:“key-10.20965”,jacii.2022.p0893-15“,“DOI-asserted-by”:“crossref”,“unstructured”:“C.Kidd和B.Y.Hayden,《好奇的心理学和神经科学》,《神经元》,第88卷,第3期,第449-460页,2015年。”,“DOI:”10.1016\/j.neuron.2015.09.010“},{“key”:“key-10.20965\/jacii.2022.p0893-16”,“doi-asserted-by”:“crossref”,”非结构化“:”B.C.Wittmann,N.D.Daw,B.Seymour,and R.j.Dolan,《纹状体活动是人类创新选择的基础》,《神经元》,第58卷,第6期,第967-973页,2008年。“,doi”:“10.1016\/j.neuron.2008.04.027”},“密钥”:“key-10.20965 \/jacii.2022.p0893-17“,“非结构化”:“X.Zhang,Y.Liu,D.Hu,and L.Liu,基于好奇和强化学习的迷宫机器人自主导航方法,第七届高级计算智能和智能信息学国际研讨会(IWACIII 2021),文章编号M1-6-1,2021。”},{“key”:“key-10.20965\/jacii.2022.p0893-18“,“doi-asserted-by”:“crossref”,“unstructured”:“H.Wicaksono,物理机器人自主导航上的u201cQ-学习行为,2011年第八届泛在机器人和环境智能国际会议,第50-54页,2011年。”,“doi”:“10.1109\/URAI.2011.6145931”},{“key”:“key-10.201965\/yacii.2022.p0893-19”非结构化”:“R.R.Al-nima,使用线性联想记忆神经网络进行图像识别,《纯粹科学》第13卷第3期第266-273页,2008年。”}],“容器-时间”:[“高级计算智能与智能信息学杂志”],“原始标题”:[],“语言”:“en”,“链接”:[{“URL”:“https:\/\/www.fujipress.jp\/main\/wp-content\/themes\/fujipress\/hyosetsu.php?ppno=JACII002600060003“,”content-type“:”unspecified“,”content-version“:”vor“,”intended-application“:”similarity-checking“}],”deposed“:{”date-parts“:[2022,11,19]],”date-time“:“2022-11-19T15:02:36Z”,”timestamp“:1668870156000},“score”:1,“resource”:{“primary”:“{”URL“:”https://www.fujipress.jp\/jacii\/jc\/jaciai 002600060893“}},”副标题“:[],”shorttitle“:[],”issued“:{”date-parts“:[2022,11,20]]},”references-count“:19,”journal-issue“:{“issue”:“6”,”published-online“:{”date-ports“:[2022,11,20]]{,”published-print“:}”dateparts“:[[2022,11,20]}},“URL”:“http://\/dx.doi.org\/10.20965\/jacii.2022.p0893”,“relation”“:{},”ISSN“:[”1883-8014“,”1343-0130“],”ISSN-type“:[{”value“:”1883-80214“,“type”:“”电子“},{”值“:”1343-0130“,”类型“:”打印“}],”主题“:[],”发布“:{”日期部分“:[2022,11,20]]}}