在我开始之前,我要感谢评论员Guy Moore和Jason Weisman分享了他们自己的解决方案,并指出了解释这个问题的不同方式。“随机球”变体是由盖·摩尔设计的。好的,我们开始吧…
无论如何,解决方案是什么?
这个问题涉及“最佳策略”,因此值得讨论这意味着什么,所以我们都站在同一个立场上。最佳策略是纳什均衡这是一组针对每个玩家的策略,如果任何一个玩家改变了他们的策略(而其他玩家保持其策略不变),那么对该玩家来说,结果会更糟糕。因此,没有一个玩家有任何改变策略的动机。
A类策略是一条根据你观察到的情况告诉你该做什么的规则。在这个游戏中,策略的一个例子是“总是以最准确的命中剩余的玩家为目标”。这是一个示例纯净的策略,因为每个玩家无论观察到什么都总是以相同的方式行事。并不是每个游戏都保证有一个由纯策略组成的纳什均衡。在某些游戏中,例如猜拳,最好使用混合战略也就是说,一种概率策略,例如“以相同的概率随机挑选岩纸或剪刀”。如果你在剪纸游戏中使用纯粹的策略,你的对手会与你对抗,你每次都会输!
事实证明,每个有限博弈都至少有一个混合纳什均衡。因此,我们不必担心没有最佳解决方案的情况。也就是说,存在许多纳什均衡是完全可能的!因此,如果事实果真如此,我们不应感到惊讶…
谋杀球vs硬币翻转球vs随机球
至少有三种方法可以解释这个问题。在第一种解释中,如果两名球员互相瞄准并击中对方,那么两名球员都将被淘汰。我将此变体称为“谋杀球”。在谋杀舞会上,没人可能赢!第二种解释是,每当两名球员相互碰撞时,我们应该掷硬币,掷硬币的失败者将被淘汰。我们还掷了一枚三元硬币,以处理三名玩家同时被淘汰的情况。我把这个叫做“硬币翻转球”。最后,我们可以将游戏解释为为玩家随机选择射击顺序。我将此变体称为“随机球”。在随机球中,如果A打B,B打C,但顺序是A先射门,则B在射门C之前被淘汰,C幸存。所有这些变体都有不同的解决方案!
两名球员
让我们从考虑只有两个玩家$P$和$Q$的情况开始;决斗!在这种情况下,没有任何决定要做。球员们总是互相瞄准。假设两个玩家分别有$p$和$q$的概率相互碰撞,我们想计算出其中一个玩家赢得决斗的概率。在谋杀球中,球员$P$只有在命中$Q$且$Q$未命中$P$时才能获胜。发生这种情况的概率为$p(1-q)$。但如果两名玩家都未命中(概率$(1-p)(1-q)$),则游戏会重复。因此,$P$成为最终赢家的可能性是:
\开始{align}
\马特布{P} _(P)&=p(1-q)\biggl(1+(1-p)(1-q\\
&=\压裂{p(1-q)}{1-(1-p)(1-q
\结束{align}重复另一个参与者的类似论点是,我们发现兴趣概率为:
\开始{聚集}
\马特布{P} _(P)=\压裂{p(1-q)}{1-(1-p)(1-q,
\qquad(平方米)
\马特布{P} (_Q)=\frac{(1-p)q}{1-(1-p)(1-q)}\\
\qquad(平方米)
\马特布{P} _0(0)=\压裂{pq}{1-(1-p)(1-q)}。
\结束{聚集}此处,$\mathbb{P} _0(0)$是两个玩家同时相互攻击的概率,因此没有人赢。当然,上述三种可能性之和为$1$。
在硬币翻转球和随机球中,如果玩家$P$在硬币翻转中相互击球,但他赢了,那么他也可以赢。事实证明,在这种情况下没有人获胜,$\mathbb{P} _0(0)上述解决方案中的美元将在两名玩家之间平均分配。
三名球员
我将详细解决谋杀案。有三名球员,每个人都可以选择目标。我们不会对所用策略的性质做出任何假设,我们将考虑使用混合策略混合策略的一个例子是“玩家$a$应该以$B$为目标,概率为$0.4$,$C$为目标概率为$0.6$”。在一些游戏中,例如猜拳,最好使用混合策略,因为如果你总是做同样的事情,你的对手会意识到这一点,你每次都会输!那么,让我们定义数字$x、y、z$如下:
\开始{align}
&A\text{targets}B\text{with prob}x\text{and targets}C\text{with prob}(1-x)\\
&B\text{targets}C\text{with prob}y\text{和targets{A\text{with prob}(1-y)\\
&C\text{targets}A\text{withprob}z\text{和targets{withprob}(1-z)
\结束{对齐}我们可以通过列举可能发生的方式来计算任何玩家获胜的概率。我将举一个例子来说明。要计算$A$获胜的概率,主要有两种方式:
- $B$和$C$同时消除,$A$生存。这种情况可以通过三种方式发生。$B$和$C$相互碰撞,或$B$碰撞$C$和$A$碰撞$B$,或$C$碰撞$B$和$A$碰撞$C$。我们还可以让每个人先存活几轮!总概率为:
\[
\裂缝{ab(1-c)xy+a(1-b)c(1-x)(1-z)+bcy(1-z
\]
- $B$先被淘汰,然后$A$以$C$赢得决斗(我们已经用$p$和$q$解决了这个问题)。无论如何,$B$一定错过了他的射门。要么$A$和$C$都瞄准$B$,至少其中一个命中,要么其中只有一个瞄准$B$s,另一个未命中。这种情况下的总概率为:
\[
\压裂{a(1-c)}{1-(1-a)(1-c
\]
- $C$先被淘汰,然后$A$与$B$决斗获胜。这种情况与前一种情况类似,总概率为:
\[
\压裂{a(1-b)}{1-(1-a)(1-b
\]
将上述三种概率相加,我们得到$\mathbb{P} _A(_A)$,$A$获胜的概率。我们可以进行类似的计算,以获得$B$获胜、$C$获胜以及没有人获胜的概率(所有四个概率的总和为$1$)。根据对称性,$\mathbb的公式{P} _B(_B)$可以通过循环排列所有变量来获得:$a\到b\到c\到a$,$x\到y\到z\到x$。最后,没有人获胜的概率是四种概率之和为一:$\mathbb{P} _0(0)=1-\mathbb{P} _A(_A)-\马特布{P} B(_B)-\马特布{P} _C(_C)$.
杀球最优策略
现在我们有了每个玩家获胜的概率,这些是函数:
\[
\mathbb公司{P} _A(_A)(x,y,z),\quad\mathbb{P} _B(_B)(x,y,z),\quad\mathbb{P} _C(_C)(x,y,z)。
\]每个函数都由$a,b,c$参数化,$a,b,c$是每个玩家的精度,并且是$(x,y,z)$的函数,使用的是(混合)策略。我们的目标是找到一个$(x,y,z)$的选择,这样就不会因为$x$本身的改变而提高$\mathbb{P} _A(A)$,仅$y$中的任何更改都无法提高$\mathbb{P} _B(_B)$,仅$z$中的任何更改都不能提高$\mathbb{P} _C(_C)$. 可以帮助我们解决这个问题的一个关键观察结果是,所有三个函数在$x$、$y$和$z$中都是线性的。优化线性函数时,最大值总是出现在边界处。这意味着必须存在纯纳什均衡!!!因此,我们可以将搜索限制为$x$、$y$和$z$分别为$0$或$1$的情况。因此,总共有8种策略。
我通过穷尽搜索计算出了纳什均衡。对于每个$(a,b,c)$的值,我计算了$(\mathbb{P} _A(_A),\mathbb{P} _B(_B),\mathbb{P} _C(_C))$对于所有8个策略,尝试更改每个策略的$(x,y,z)$,以查看它是否是纳什均衡,如果我找到多个纳什均衡点,我会随机选择一个。然后,我画了一个图,说明谁在何时获胜。当$a=1$时,我们得到以下图片:
真是一团糟!这里有很多纳什均衡,几乎任何事情都可能发生。原因是,如果没有硬币翻转,阿伯特瞄准的球员将永远失败。所以,事实上,玩家所做的任何事情都是最优的!那个输掉比赛的球员对剩下的球员获胜有很大的影响,因此会产生混乱的解决方案。然而,这些纳什均衡大多是不稳定的也就是说,如果我们将雅培的准确度更改为$a=0.99$,则情况会完全改变:
硬币翻转球优化策略
我将省略Coinflip-ball的推导,因为代数写起来相当冗长和乏味,但这个想法在精神上与我推导Murder-ball变量的概率的方法类似。正如在Murder ball案例中一样,所有概率在$(x,y,z)$中都是线性的,所以再次强调,纯纳什均衡必须存在。如上所述,我使用了一个详尽的搜索来绘制每个玩家获胜的概率。这是我在$a=1$的情况下得到的结果。
对于大多数情况,策略是显而易见的。例如,当$b=0.8$和$c=0.5$时,最佳策略是雅培和鲍勃互相瞄准,科斯特洛瞄准雅培。在这种情况下,科斯特洛大部分时间都赢了!在右上角,你会注意到可能的结果是混合的,因为那里有多重纳什均衡。在该地区,三名球员都非常准确,联合阿博特的策略不再是最佳的。在这种情况下,三个玩家在一条链(a到B到C到a)或(a到C到B到a)中相互瞄准对方是纳什最优的。这是游戏规则的结果。在我对掷硬币游戏的解释中,如果三名玩家同时相互击球,游戏的结果取决于每个玩家都有平等的获胜机会的掷硬币游戏。
随机球最优策略
再次,我省略了推导。这种情况产生了与其他两种情况类似的解,其中纯纳什均衡始终存在。然而,在这种情况下,它甚至更好:纳什均衡是唯一的!这意味着对所有参与者都有一个明确的最佳策略。这是我在$a=1$的情况下得到的结果。
纳什均衡的唯一性反映在每个区域都是实心的;任何地方都没有重叠。
雅培不准确
当然,我必须看看在雅培不完全准确的情况下会发生什么。准备好让你的头脑崩溃…
以下是Coinflip-ball的案例:
您会注意到,当$a=0$时,最佳解决方案只是沿着直线$b=c$分割,在该直线上,更准确的玩家获胜。这很有道理;无论阿伯特做什么,他都会输,所以剩下的两名球员需要决一雌雄。
以下是谋杀球的案例:
这一次,在$a=0$的情况下,鲍勃和科斯特洛没有受到雅培的威胁,所以他们互相攻击。如果Bob和Costello都非常准确,那么他们很有可能互相淘汰,在这种情况下,Abbott赢了!
最后,这里是Random-ball的例子: