阿里·埃斯拉;Jerzy A.Filar。;迈克尔·海索普 哈密尔顿循环问题的混合模拟优化算法。 (英语) Zbl 1233.90270号 安·Oper。物件。 189, 103-125 (2011). 摘要:本文综合交叉熵方法和马尔可夫决策过程,提出了一种新的哈密顿循环问题的混合算法。特别地,该算法为每个弧指定一个随机长度,并将哈密顿循环问题转化为旅行商问题。因此,现在有一个对应于每个弧的概率,表示事件“此弧位于最短行程”的概率。然后按照交叉熵方法更新这些概率,并用于设置合适的线性规划模型。如果后者的解产生任何回路,则该图是哈密顿图。数值结果表明,当图的大小很小,例如小于50个节点时,算法很有可能通过随机生成哈密顿循环而终止于交叉熵分量。然而,对于较大的图,在大多数测试中,算法在其优化组件中终止(通过求解所提出的线性程序)。 引用于7文件 MSC公司: 90立方厘米35 涉及图形或网络的编程 90C27型 组合优化 90 C59 数学规划中的近似方法和启发式 90立方厘米 数学规划中的最优性条件和对偶性 关键词:哈密顿回圈问题;马尔可夫决策过程;交叉熵方法 软件:协和式飞机 PDF格式BibTeX公司 XML格式引用 \textit{A.Eshragh}等人,Ann.Oper。第189号、第103-125号决议(2011年;Zbl 1233.90270) 全文: 内政部 参考文献: [1] Ali,S.M.和;Silvey,S.D.(1966年)。一种分布与另一种分布的散度系数的一般类别。《皇家统计学会杂志》,B,28,131-142·Zbl 0203.19902号 [2] Applegate,D.L.,Bixby,R.E.,Chvatal,V.和;库克·W·J(2007)。旅行推销员问题:一项计算研究。普林斯顿:普林斯顿大学出版社。 [3] Botev,Z.I.和;Kroese,D.P.(2008)。用于稀有事件概率估计、组合优化和计数的有效算法。应用概率的方法与计算,10(4),471-505·Zbl 1293.65004号 ·doi:10.1007/s11009-008-9073-7 [4] Costa,A.、Jones,O.D.和;Kroese,D.(2007年)。离散优化交叉熵方法的收敛性。《运营研究快报》,35(5),573–580·Zbl 1149.90184号 ·doi:10.1016/j.orl.2006.11.005 [5] 交叉熵方法(2009)。http://www.cemethod.org/ . 2009年2月11日访问。 [6] Ejov,V.、Filar,J.A.、Murray,W.和;Nguyen,G.T.(2008a)。图的行列式和最长循环。SIAM离散数学杂志,22(3),1215-1225·Zbl 1175.05075号 ·数字对象标识代码:10.1137/070693898 [7] Ejov,V.、Filar,J.、Haythorpe,M.和;Nguyen,G.(2008b)。哈密顿循环问题的基于改进MDP的分枝定界算法。运筹学数学(待发)·Zbl 1210.90172号 [8] Eshragh,A.和;Modarres,M.(2009)。一种新的分布拟合方法:信念决策。《工业与系统工程杂志》(即将出版)。 [9] Eshragh Jahromi,A.和;Akhavan Niaki,S.T.(2003)。信念决策在响应面方法中的应用。2003年,德国柏林,国际统计研究所第五十四届会议记录。 [10] Feinberg,E.A.(2000年)。约束折扣马尔可夫决策过程和哈密顿循环。运筹学数学,25(1),130-140·Zbl 1073.90567号 ·doi:10.1287/门.25.1.130.15210 [11] Filar,J.A.(2006)。受控马尔可夫链、图和;哈密顿性。随机系统基金会和趋势®,1(2),77–162·Zbl 1211.90273号 ·doi:10.1561/0900000003 [12] Filar,J.A.和;Krass,D.(1994)。哈密顿圈和马尔可夫链。运筹学数学,19(1),223-237·Zbl 0801.90113号 ·doi:10.1287/门.19.1.223 [13] Filar,J.A.,&;Vrieze,K.(1996)。竞争马尔可夫决策过程(第1版)。柏林:斯普林格·Zbl 0934.91002号 [14] Gentle,J.E.(2004)。随机数生成和蒙特卡罗方法(第二版)。柏林:斯普林格·Zbl 0972.65003号 [15] Luenberger,D.G.(2003)。线性和非线性规划(第二版)。多德雷赫特:Kluwer学术出版社·Zbl 1134.90040号 [16] Margolin,L.(2005)。关于交叉熵方法的收敛性。《运筹学年鉴》,134,201–214·Zbl 1074.90038号 ·doi:10.1007/s10479-005-5731-0 [17] Puterman,M.L.(2005)。马尔可夫决策过程:离散随机动态规划(第1版)。纽约:Wiley-Interscience·Zbl 1184.90170号 [18] Rubinstein,R.Y.(1997)。具有罕见事件的计算机模拟模型的优化。欧洲运筹学杂志,99,89–112·Zbl 0923.90051号 ·doi:10.1016/S0377-2217(96)00385-2 [19] 鲁宾斯坦,R.Y.(1999)。用于组合和连续优化的交叉熵方法。应用概率的方法与计算,2127-190·Zbl 0941.65061号 ·doi:10.1023/A:101091220143 [20] Rubinstein,R.Y.,&;Kroese,D.P.(2004)。交叉熵方法:组合优化、蒙特卡罗模拟和机器学习的统一方法。柏林:斯普林格·Zbl 1140.90005号 [21] Vaisman,R.(2009)。TSP随机巡更生成算法。http://iew3.technion.ac.il/CE/pubs.php . 访问日期:2009年2月11日。 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。