爱奥那州杜米特里乌;特塔利,普拉萨德;彼得·温克勒 用两个球打高尔夫球。 (英语) Zbl 1032.60065号 SIAM J.离散数学。 16,第4期,604-615(2003). 作者小结:我们分析并解决了一个博弈,在这个博弈中,玩家选择几个马尔可夫链中的哪一个来前进,目标是最小化其中一个链到达目标状态的期望时间(或成本)。该解决方案需要计算(多项式时间)单个链状态的函数(gamma)-各种“Gittins指数”,最小化该函数会产生最优策略。结果表明,\(\gamma\)是马尔可夫链的预期命中时间的有用表亲,但它是定义的,例如,即使对于无限图上的随机游动也是如此。我们推导了\(\gamma\)的基本性质,并考虑了它在某些自然情况下的值。审核人:Gheorghe Oprišan(布库雷什蒂) 引用于2评论引用于9文件 MSC公司: 60J10型 马尔可夫链(离散状态空间上的离散时间马尔可夫过程) 90立方厘米 马尔可夫和半马尔可夫决策过程 60克40 停车时间;最优停车问题;赌博理论 关键词:基廷斯指数;马尔可夫链;马尔可夫决策理论;随机游走 PDF格式BibTeX公司 XML格式引用 \textit{I.Dumitriu}等人,SIAM J.离散数学。16,第4号,604--615(2003;Zbl 1032.60065) 全文: 内政部