×

基于(mathrm{AO}^{*})的加拿大旅行者问题精确算法。 (英语) Zbl 1338.90278号

概要:加拿大旅行者问题(CTP)是一个简单但具有挑战性的随机优化问题,其中给代理一个图,其中一些边以一定的概率被阻塞,这些边的状态可以在到达事件顶点时动态消除歧义。目标是设计一个遍历策略,使给定的起始顶点和终止顶点之间的预期行走长度最短。CTP已被证明在许多广泛的环境中难以解决。本文介绍了一种基于马尔可夫决策过程公式的问题优化算法,它是利用CTP中的特殊问题结构对(mathrm{AO}^{*})搜索的新改进。我们称我们的算法为\(\mathrm{CAO}^{*}\),它表示带缓存的\(\mathrm{AO}^{}\)\(\mathrm{CAO}^{*}\)使用缓存机制避免重新扩展以前访问的状态,并使用节点级别的允许上界进行动态状态空间修剪\(\mathrm{CAO}^{*})不是多项式时间,但它可以大大缩短为中等大小的实例找到精确解决方案所需的执行时间。我们对涉及实际海上雷场数据集的问题的实际变体进行了计算实验。

MSC公司:

90立方厘米 随机规划
90立方厘米 马尔可夫和半马尔可夫决策过程
90立方厘米 涉及图形或网络的编程
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Aksakalli V(2007)带动态学习的随机最短路径问题的BAO^{*}算法。程序。第46届IEEE Conf.决策控制(Wiley-IEEE出版社,新泽西州霍博肯),6003-6008。交叉参考
[2] Aksakalli V,Ari I(2014)随机障碍场景问题的基于惩罚的算法。信息J.计算。26(2):370-384. 链接·兹比尔1356.90157
[3] Aksakalli V,Ceyhan E(2012)《消除歧义的最佳障碍物放置》。附录申请。斯达。6(4):1730-1774. 交叉参考·Zbl 1454.62280号
[4] Aksakalli V,Fishkind DE,Priebe CE,Ye X(2011)导航随机障碍物场的重置消歧策略。海军后勤研究。58(4):389-399. 交叉参考·Zbl 1214.90123号
[5] Baglietto M,Battistelli G,Vitali F,Zoppoli R(2003)随机图上的最短路径问题:神经动态规划方法。程序。第42届IEEE会议决策控制(新泽西州霍博肯市威利-艾艾出版社),6187-6193。交叉参考
[6] Bander JL,White CC(2002)带终端费用的非平稳随机最短路径问题的启发式搜索方法。运输科学。36(2):218-230. 链接·Zbl 1134.90323号
[7] Blei DM,Kaelbling LP(1999)动态不确定域中的最短路径。程序。IJCAI自适应空间表示动态环境研讨会。(AAAI出版社,加利福尼亚州帕洛阿尔托)。
[8] Bnaya Z、Felner A、Fried D、Maksin O、Shimony SE(2011)重复任务加拿大旅行者问题(AAAI出版社,加利福尼亚州帕洛阿尔托)。
[9] Bonet B(2009)重新审视了确定性POMDP。程序。第25届Conf.不确定性人工智能(AAAI出版社,加利福尼亚州帕洛阿尔托),59-66。
[10] Chang CR,Slagle JR(1971)搜索和/或图的一种允许的最佳算法。人工智能2(2):117-128. 交叉参考·Zbl 0227.68016号
[11] Chang HS,Marcus SI(2003)马尔可夫决策过程的近似滚动时域方法:平均报酬情况。数学杂志。分析。申请。286(2):636-651. 交叉参考·兹比尔1064.90051
[12] de Farias DP,Roy BV(2003)近似动态规划的线性规划方法。操作。物件。51(6):850-865. 链接·兹比尔1165.90666
[13] Eyerich P、Keller T、Helmert M(2009)《加拿大旅行者问题的高质量政策》。程序。第24届AAAI人工智能大会(AAAI出版社,加利福尼亚州帕洛阿尔托),51-58。
[14] Fawcett J,Robinson P(2000)《道路交通自适应路线》。IEEE组件。图形应用程序。20(3):46-53. 交叉参考
[15] Ferguson D,Stenz A,Thrun S(2004),PAO^{*},《带隐藏状态的规划》。程序。2004 IEEE国际。Conf.机器人自动化(Wiley-IEEE出版社,新泽西州霍博肯),2840-2847。交叉参考
[16] Fiosins M,Fiosia J,Müller JP,Görmer J(2011)《城市交通中面向智能体的车辆仿真中协调战略和战术决策》。程序。第四国际。ICST Conf.仿真工具技术(计算机科学、社会信息学和电信工程研究所,布鲁塞尔),144-151。交叉参考
[17] Fishkind DE、Priebe CE、Giles K、Smith LN、Aksakalli V(2007)《基于风险模拟的消歧协议》。IEEE传输。系统,人,控制论,A部分37(5):814-823. 交叉参考
[18] Fried D,Shimony SE,Benbassat A,Wenner C(2013)加拿大旅行者问题变体的复杂性。理论。计算。科学。487: 1-16. 交叉参考·Zbl 1277.68087号
[19] Kearns M,Singh S(2002),多项式时间内的近最优强化学习。机器学习49(2):209-232. 交叉参考·Zbl 1014.68071号
[20] Likhachev M,Stentz A(2009),概率规划,对缺失信息有明确偏好。人工智能173(5-6):696-721. 交叉参考·兹比尔1191.68637
[21] Martelli A,Montanari U(1978)通过启发式引导搜索优化决策树。通信ACM21(12):1025-10039. 交叉参考·Zbl 0395.90079号
[22] Nikolova E,Karger DR(2008)《不确定性下的路线规划:加拿大旅行者问题》。程序。第23届AAAI人工智能大会(AAAI出版社,加利福尼亚州帕洛阿尔托),969-974。
[23] 新泽西州尼尔森市(1980)人工智能原理(Morgan Kaufmann,加利福尼亚州帕洛阿尔托)。
[24] Papadimitriou CH,Yannakakis M(1991)《无地图的最短路径》。理论。公司。科学。84(1):127-150. 交叉参考·Zbl 0733.68065号
[25] Priebe CE、Fishkind DE、Abrams L、Piatko CD(2005)《穿越已绘制危险区域的随机消歧路径》。海军后勤研究。52(3):285-292. 交叉参考·Zbl 1079.90012号
[26] Sahin OF,Aksakalli V(2014)加拿大旅行者问题的快速有效在线算法。Finzi A,Orlandini A,编辑。程序。ICAPS车间规划机器人(AAAI,加利福尼亚州帕洛阿尔托),166-171。
[27] Smith DL(1995)《地雷和类地雷目标探测技术》。程序。SPIE公司(华盛顿州贝灵汉国际光学工程学会),404-408。
[28] Witherspoon NH、Holloway JH、Davis KS、Miller RW、Dubey AC(1995)雷场探测沿海战场侦察与分析(COBRA)计划。程序。SPIE公司(国际光学工程学会,华盛顿州贝灵汉),500-508。
[29] Xu Y,Hu M,Su B,Zhu B,朱Z(2009)加拿大旅行者问题及其竞争分析。J.组合选项。18(2):195-205. 交叉参考·兹比尔1173.90524
[30] Ye X,Priebe CE(2010)一种基于图搜索的导航算法,用于消除潜在危险区域的歧义。国际。《运营杂志》。Res.通知。系统。1(3):14-27. 交叉参考
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。