×

兹马思-数学第一资源

室内移动机器人导航的度量拓扑图学习。(英语) Zbl 0903.68150
小结:自主机器人必须能够学习和维护环境模型。移动机器人导航的研究产生了两种主要的室内环境地图绘制模式:基于网格的和拓扑的。虽然基于网格的方法可以生成精确的度量图,但它们的复杂性通常会妨碍在大规模室内环境中进行有效的规划和解决问题。另一方面,拓扑图可以更有效地使用,但是在大规模的环境中,准确和一致的拓扑图通常很难学习和维护,特别是在瞬时传感器数据高度模糊的情况下。本文描述了一种集成两种范式的方法:基于网格和拓扑。利用人工神经网络和朴素贝叶斯积分对基于网格的地图进行学习。拓扑图是在基于网格的地图上生成的,通过将网格划分为相关区域来生成。通过结合这两种范式,本文提出的方法从两个方面都获得了优势:准确性/一致性和效率。文中给出了一种多人环境下机器人自主作业的探索和结果。

理学硕士:
68T05型 人工智能中的学习与自适应系统
68U99 计算方法与应用
PDF格式 BibTeX公司 XML 引用
全文: 内政部
参考文献:
[1] 巴尔奇,T。;布恩,G。;科林斯,T。;福布斯,H。;麦肯齐博士。;Santamaria,J.C.,Io,ganymede and callisto—一个多智能体机器人清洁团队,AI杂志,16,1,(1995)
[2] 巴托,A.G。;布拉特克,S.J。;Singh,S.P.,学习使用实时动态规划行动,人工智能,7281-138,(1995)
[3] 巴斯耶,K。;迪恩,T。;Kaelbling,L.P.,《学习动力学:感知障碍代理人的系统识别》,人工智能,72139-171,(1995)
[4] Bellman,R.E.,动态规划(1957),普林斯顿大学出版社,新泽西州
[5] 另外:IEEE Trans。机器人和自动化(即将出现)。
[6] 邦迪,J。;Murty,U.,《图论与应用》(1976),爱思唯尔纽约·Zbl 1226.05083
[7] 博伦斯坦,J。;埃弗雷特,B。;Feng,L.,《导航移动机器人:系统和技术》(1996),A.K.Peters,Ltd.,马萨诸塞州韦尔斯利市·Zbl 0852.93003
[8] 博伦斯坦,J。;Koren,Y.,移动机器人的向量场直方图快速避障,IEEE J.机器人与自动化,7,3,278-288,(1991)
[9] 布曼,J。;W.伯加德。;克雷默斯,A.B。;福克斯,D。;霍夫曼,T。;施耐德,F。;斯特里科斯,J。;Thrun,S.,移动机器人犀牛,AI杂志,16,1,(1995)
[10] W.伯加德。;福克斯,D。;亨尼格,D。;施密特,T.,使用位置概率网格估计移动机器人的绝对位置,()
[11] W.伯加德。;福克斯,D。;亨尼格,D。;施密特,T.,位置概率网格的位置跟踪,()
[12] W.伯加德。;福克斯,D。;Thrun,S.,主动移动机器人定位,()·Zbl 0971.68162
[13] 《机器人运动规划的复杂性》(1987),麻省理工学院出版社,马萨诸塞州剑桥
[14] 坎尼,J.F。;唐纳德,B.R.,简化沃罗诺图,离散计算。《地理》,3129-236,(1988年)·零担0642.52007
[15] 查蒂拉,R。;劳蒙德,J.-P.,移动机器人的位置参考和一致性世界建模,()
[16] Choset,H.,基于传感器的运动规划:分层广义Voronoi图,()
[17] 乔塞特,H。;科努克斯文,I。;Burdick,J.W.,基于传感器的平面杆机器人规划,()
[18] 乔塞特,H。;科努克斯文,I。;《基于传感器的规划:生成广义Voronoi图的控制律》,(上)
[19] 周恩来。;卡普兰S。;Kortenkamp,D.,《原型、位置和联想网络(plan):走向认知映射的统一理论》,《认知科学》,19,1-51,(1995)
[20] 克里斯曼,L.,《知觉混淆强化学习:知觉区分方法》,()
[21] 科莱特,T.S。;Cartwright,B.A.,蜜蜂的里程碑式学习,J.比较生理学(1985年1月)
[22] Cox,I.J.,Blanche自主机器人车辆导航和导航实验,IEEE trans。《机器人与自动化》,7193-204,(1991)
[23] Cox,I.J.,使用贝叶斯多假设方法建模动态环境,人工智能,66311-344,(1994)·Zbl 0807.68072
[24] 标准,R.H。;Barto,A.G.,使用强化学习提高电梯性能,()·Zbl 0913.68174
[25] 《利用超声波测距进行移动机器人的世界建模与位置估计》,第674-680页
[26] 大雁,P。;辛顿,G.E.,封建强化学习,()
[27] T.L.迪恩。;《时变规划分析》,第49-54页
[28] T.L.迪恩。;林世华,随机区域规划之分解技术,()
[29] 德劳内,B.N.,苏拉斯维德,793-800·Zbl 0010.41101
[30] 杜达,R.O。;Hart,P.E.,模式分类和场景分析,(1973),Wiley纽约·中银0277.68056
[31] Elves,A.,基于声纳的真实世界地图和导航,IEEE J.机器人与自动化,3,3,249-265,(1987)
[32] Elfes,A.,占用网格:机器人感知和导航的概率框架,()
[33] 《被动地图学习与视觉位置识别》,(英文)
[34] 恩格尔森S。;麦克德莫特,D.,《移动机器人地图学习中的误差修正》,第2555-2560页
[35] 费多,C.,TCX。建立机器人体系结构的进程间通信系统,()
[36] D、 Fox,W.Burgard,S.Thrun,碰撞避免的动态窗口方法,IEEE机器人技术与自动化(即将出版)
[37] 弗林豪斯,T。;Buhmann,J.M.,移动机器人实时相位立体声,()
[38] 弗林豪斯,T。;Buhmann,J.M.,正则化基于相位的立体声,()
[39] 吉巴斯,L.J。;努特,D.E。;谢里尔,M。;吉巴斯,L.J。;努特,D.E。;Sharir,M.,Delaunay和Voronoi图的随机增量构造,(),7414-431,(1992年),也在:·Zbl 0765.68207
[40] Gutmann,J.-S.,Vergleich von algorithmen zur Selbstlokaliserung eines mobilen roboters,()
[41] 古佐尼,D。;切耶,A。;朱莉娅,L。;科诺利奇,K.,许多机器人做短工,(),55-64,1
[42] 赫兹,J。;克罗,A。;Palmer,R.G.,神经计算理论导论,(1991),加利福尼亚州艾迪生-韦斯利-红杉城
[43] 辛克尔,R。;《快速移动机器人中激光雷达对环境的感知》,第68.1-68.7页
[44] 霍尔特,R。;姆卡迪,T。;齐默,R.M。;麦克唐纳,A.J.,通过抽象加速问题解决:面向图的方法,人工智能,85321-361,(1996)
[45] Howard,R.A.,动态规划与马尔可夫过程(1960),麻省理工学院出版社剑桥,马萨诸塞州,威利,纽约·Zbl 0091.16001
[46] 《随机域中的分层学习:初步结果》,第167-173页·Zbl 0994.68154
[47] 凯尔布林律师事务所。;卡桑德拉,A.R。;Kurien,J.A.,不确定性下的行为:移动机器人导航的离散贝叶斯模型,()
[48] 凯尔布林律师事务所。;利特曼,麻省理工学院。;《强化学习导论》,第90-127页
[49] Kaiman,R.E.,线性滤波和预测问题的新方法,Trans。ASME J.基础工程,82,35-45,(1960)
[50] 卡夫拉基,L。;《快速路径规划配置空间的随机预处理》,第2138-2145页
[51] 国王。;韦曼,C.,帮助伴侣自主移动机器人导航系统,(),第190-198页
[52] Knoblock,C.A.,自动生成计划抽象,人工智能,68243-302,(1994)·Zbl 0942.68712
[53] 柯尼希,S。;Simmons,R.,机器人导航的被动远程学习,()
[54] D、 Kortenkamp,R.P.Bonassi,R.Murphy(编辑),《基于人工智能的移动机器人:成功机器人系统的案例研究》,麻省理工学院出版社,剑桥,马萨诸塞州(即将出版)。
[55] 科滕坎普,D。;努尔巴什,I。;Hinkle,D.,1996年AAAI移动机器人竞赛与展览,AI杂志,18,1,25-32,(1997)
[56] 科滕坎普,D。;韦茅斯,T.,《利用声纳和视觉感知相结合的移动机器人拓扑图》,第979-984页
[57] 库克,R。;Siegel,M.W.,声学传感器机器人导航的物理仿真模型,IEEE trans。模式识别机国际,,(1987)
[58] 柯伊伯,B。;杨永元,未知环境下空间学习的稳健定性方法,()
[59] 柯伊伯,B.J。;《基于空间表示、机器人学和自主系统语义层次的机器人探索与制图策略》,8,47-63,(1991)
[60] 柯伊伯,B.J。;Levitt,T.S.,《大尺度空间中的导航和制图》,AI杂志,9,2,25-43,(1988)
[61] Latombe,J.-C.,机器人运动规划,(1991),Kluwer学术出版社,马萨诸塞州波士顿
[62] 伦纳德,J.J。;Durrant Whyte,H.F.,用于移动机器人导航的声纳传感(1992),Kluwer学术出版社,马萨诸塞州波士顿·Zbl 0760.68008
[63] 伦纳德,J.J。;达兰特·怀特,H.F。;Cox,I.J.,自主移动机器人的动态地图构建,国际互联网。J、 《机器人研究》,11,4,89-96,(1992)
[64] 林立杰,强化与人工神经网路自监督学习,()
〔65〕 Ljung,L.,《用户系统识别理论》(1987),新泽西州普伦蒂斯霍尔恩格尔伍德悬崖·Zbl 0615.93004
[66] 卢,F。;米利奥斯,E.,《用于环境测绘的全球一致性范围扫描校准》,自主机器人,4333-349,(1997)
[67] F、 吕,E。米利奥斯,通过匹配二维距离扫描进行未知环境中的机器人姿态估计,J。智能与机器人系统(待发表)。
[68] 还有:麻省理工学院,人工智能实验室,技术报告AITR-1228。
〔69〕 McCallum,R.A.,强化学习的基于实例的状态识别,()
[70] Mitchell,T.M.,机器学习(1997年),纽约麦格劳希尔出版社·Zbl 0913.68167
[71] 穆尔,A.W.,多维状态空间中变分辨率强化学习的parti对策算法,(),711-718
[72] 摩尔,A.W。;Atkeson,C.G.,优先清扫:用更少的数据和更少的时间进行强化学习,机器学习,13103-130,(1993)
[73] Moravec,H.P.,移动机器人确定性网格中的传感器融合,AI杂志,9,2,61-74,(1988)
[74] 莫拉维奇,H.P。;《广角声纳高分辨率地图》,第116-121页
[75] 莫泽尔,医学博士。;巴赫拉赫,J.R.,通过探索发现反应性环境的结构,()
[76] 美国尼赫索夫。;史密瑟斯,T。;Hallam,J.,使用自组织特征地图的移动机器人位置识别,()
[77] H、 Neven,G.Schöner,由图像相关性参数控制的动力学组织机器人导航,生物控制论(即将出现)。
[78] Nilsson,N.J.,《人工智能原理》(1982年),柏林斯普林格出版社·Zbl 0474.68094
[79] 努尔巴什,I。;权力,R。;Birchfield,S.,DERVISH an office navigating robot,AI杂志,16,2,53-60,(1995)
[80] 奥德兰,C。;叶国平,张国强,圆盘运动规划之回缩方法,J.演算法,6104-111,(1982)·Zbl 0556.68051
[81] 欧姆林,C.W。;Giles,C.L.,在递归神经网络中构造确定性有限状态自动机,J.ACM,45,6,937,(1996)·Zbl 0883.68105
[82] Pearl,J.,《智能系统中的概率推理:似是而非的推理网络》(1988),Morgan Kaufmann San Mateo,CA
[83] 彼得斯,L。;苏尔曼,H。;郭,S。;贝克,K。;《自动文摘》,1994年
[84] 皮尔斯,D。;柯伊伯,B.J.,学习探索和绘制地图,(),1264-1271
[85] 彭德良,博士,基于知识的机器人自主驾驶神经网络训练,(),第19-43页
[86] 普特曼,M.L.,马尔科夫决策过程,(1994),约翰威利和儿子纽约·Zbl 0336.93047
[87] 《隐马尔可夫模型及其在语音识别中的若干应用教程》,(IEEE日志编号8825949)·Zbl 0762.62036
[88] 《动子问题的复杂性与推广》,第421-427页
[89] 伦肯,W.D.,使用超声波传感器的移动机器人的同步定位和地图构建,(),2129-2197
[90] 里维斯特,R.L。;夏皮尔,R.E.,基于多样性的有限自动机推理,()·Zbl 0821.68085
[91] 里维斯特,R.L。;谢皮尔,R.E.,确定性环境中无监督学习的新方法,(),第364-375页
[92] 鲁梅尔哈特特区。;辛顿,G.E。;Williams,R.J.,通过错误传播学习内部表现,()
[93] 罗素,S。;诺维格,P.,《人工智能:现代方法》(1995年),新泽西州普伦蒂斯霍尔恩格伍德悬崖·Zbl 0835.68093
[94] 斯基尔,B。;克劳利,J.,《使用占用网格的位置估计技术的比较》,第1628-1634页
[95] Schneider,F.E.,传感器判读与kartenerstellung Für移动机器人,()
[96] 施瓦茨,J.T。;沙里尔,M。;Hopcroft,J.,《机器人运动的规划、几何和复杂性》(1987),Ablex出版公司,新泽西州诺伍德
[97] 沙特凯,H;Kaelbling,L.,学习局部里程信息较弱的拓扑图,()·Zbl 0994.68154
[98] 谢泼德,D.,《不规则间隔数据的二维插值函数》,第517-523页
[99] Simmons,R.,1994年AAAI机器人竞赛与展览,AI杂志,16,1,(1995)
[100] 西蒙斯,R。;柯尼格,S.,《部分可观测环境中的概率机器人导航》,第页,第1080-1087页
[101] Singh,S.P.,通过组合元素顺序任务的解决方案来转移学习,机器学习,8,(1992)·Zbl 0772.68073
[102] ()
[103] 《时间差分学习中的实际问题》,机器学习,8,(1992)·Zbl 0772.68075
[104] 《移动机器人领域的探索与模型建立》,第175-180页
[105] Thrun,S.,移动机器人导航中地标发现和主动感知的贝叶斯方法,()
[106] Thrun,S.,To know or not know:on the utility of models in mobile robotics,AI杂志,18,1,47-54,(1997年)
[107号] 特伦,S。;Bücken,A.,集成基于网格和拓扑图的移动机器人导航,()
[108] S、 Thrun,A.Bücken,W.Burgard,D.Fox,T.Fröhlinghaus,D.Hennig,T.Hofmann,M.Krell,T.Schimdt,《RHINO中的地图学习和高速导航》,in:D.Kortenkamp,R.P.Bonasso,R.Murphy(编辑),《基于人工智能的移动机器人:成功机器人系统的案例研究》。麻省理工学院出版社,剑桥,马萨诸塞州(即将出版)。
[109] S、 Thrun,D.Fox,W.Burgard,移动机器人的并行映射和定位的概率方法,机器学习和自主机器人(联合问题),即将出现·Zbl 0907.68148
[110] 特伦,S。;施瓦茨,A.,在强化学习中寻找结构,()
[111] 托伦斯,M.C.,与机器人的自然交流,()
[112] 尤杜帕,S.,《计算机控制机械手中的碰撞检测与避免》,()
[113] Vapnik,V.,《基于统计数据的依赖性估计》(1982年),Springer Berlin
[114] 瓦洛塞克,P.,现实主义模拟在埃切特移动机器人,()
[115] 卫β,G。;韦茨勒,C。;冯普特卡默,E.通过测距仪扫描的相关性跟踪室内移动系统的位置和方向,(),第595-601页
[116] 白痴,白痴。;卡尔森,J。;《通过任务分解和动态策略合并学习多目标行为》,第45-78页
[117] 还有:苏格兰爱丁堡大学人工智能系第751号戴氏研究论文。
[118] 山口B。;Beer,R.,动态环境中导航的空间学习,学习自主机器人,IEEE trans。系统人控制网络。—第二部分:控制论,(1996年),同时:
[119] B、 Yamauchi,P.Langley,动态环境中的位置识别,in:移动机器人(特刊),J.机器人系统(即将出版)·Zbl 1113.68546
[120] 张伟。;《具有时延TD(lambda)网络的高性能作业车间调度》,第页,1024-1030页
〔121〕 Zimmer,U.R.,《真实世界中的鲁棒世界建模和导航》,神经计算,13,2-4,(1996)
此参考列表基于出版商或数字数学图书馆提供的信息。它的项被试探性地匹配到zbMATH标识符,并且可能包含数据转换错误。它试图尽可能准确地反映原始论文中列出的参考文献,而不要求匹配的完整性或精确性。