×

用两个球打高尔夫球。 (英语) Zbl 1032.60065号

作者小结:我们分析并解决了一个博弈,在这个博弈中,玩家选择几个马尔可夫链中的哪一个来前进,目标是最小化其中一个链到达目标状态的期望时间(或成本)。该解决方案需要计算(多项式时间)单个链状态的函数(gamma)-各种“Gittins指数”,最小化该函数会产生最优策略。结果表明,\(\gamma\)是马尔可夫链的预期命中时间的有用表亲,但它是定义的,例如,即使对于无限图上的随机游动也是如此。我们推导了\(\gamma\)的基本性质,并考虑了它在某些自然情况下的值。

MSC公司:

60J10型 马尔可夫链(离散状态空间上的离散时间马尔可夫过程)
90立方厘米 马尔可夫和半马尔可夫决策过程
60克40 停车时间;最优停车问题;赌博理论
PDF格式BibTeX公司 XML格式引用
全文: 内政部