躲避球决斗

这是一个来自Riddler公司三名躲避球选手,谁能幸存下来?

三名专业躲避球手进行决斗,即“真实”决斗,他们同时捡起一个球并试图击中另一个。然后,所有幸存者立即重新开始,试图再次相撞。它们速度一样快,但精度不一样。将他们命名为雅培、鲍伯和科斯特洛。每种方法的精度分别为a、b和c。也就是说,如果阿伯特的目标是什么,他用概率a命中它,用概率b命中鲍勃,用概率c命中科斯特洛。每个玩家的能力都为其他玩家所知。假设阿伯特是一个完美的射门:a=1。假设玩家遵循一个最优策略,目标是生存。鲍伯和科斯特洛的能力(b和c)的每一种可能组合,哪个球员最有可能在这场比赛中幸存下来?

这是我的解决方案:
[显示解决方案]

对《躲避球决斗》的14点思考

  1. 劳伦特,你好,
    非常有趣。然而,我对这个问题的解释有些不同。
    在更简单的版本(Riddler Express)中,它指出,当两名速度相同的选手比赛时,每名选手都有1/2的获胜机会——先投掷硬币,当他们击球时,另一名选手在还击前死亡。因此,我对这个问题的解释是,“射门”的顺序是随机的(A在B之前射门,C之前射门的概率各为1/6,其他5种排列的概率各有1/6),而不是完全同步的。在这种情况下,最佳策略是相同的,但结果有些不同,特别是如果有人在a射门之前先从a身上射门,那么B就可以赢。在这种情况中,有一个大B和中c的区域,B获胜的机会最大(而且总有人赢)。
    特别是我发现A获胜的概率是
    (2-b)(2-3c+c^2)/4
    B获胜,假设B>c
    b(2-c)(3b+3c-2bc)/(12(b+c-bc))
    C获胜的概率是1减去这两者的总和。这导致了
    https://theorie.ikp.physik.tu-darmstadt.de/qcd/wins.pdf
    (请原谅图片太差)

    1. 整洁!我对这个问题进行了更多的思考,实际上,我认为我的解决方案是不完整的(尽管有不同的解释)。明天我有时间的时候会更新我的博客帖子……敬请期待!

  2. 我把这个谜题解释为运动员在每轮比赛中同时投掷。如果两人准确地相互投掷,则通过掷硬币决定胜负。

    如果玩家P和Q互相掷骰子,有四种可能的结果:
    1.两人都准确投掷,概率pq,Pp=0.5,pq=0.5
    2.P投得准确,Q不准确,概率为P(1-Q),Pp=1,Pq=0
    3.P抛出不准确,Q准确,概率(1-P)Q,Pp=0,Pq=1
    4.使用(1-p)(1-q),Pp=p,Pq=q(再次抛出),两者抛出不准确

    P获胜概率:
    P=0.5pq+P(1-q)+(1-P)(1-q

    简化,
    P=P(1-q/2)/(P+q-pq)
    Q=Q(1-p/2)/(p+Q-qp)

    按照上面描述的类似逻辑,B和C总是在第1轮以A为目标。如果B>c,A将以B为目标,如果c>B,则以c为目标。

    假设,在不损失一般性的情况下,b>c。

    在“truel”中,C在第一轮获胜的概率为(1-b/2)C,即A击败b,C准确投掷并淘汰A。

    否则,如果A赢了B,C投得不准确,那么A在第二轮就对C投。发生这种情况的概率为(1-b/2)(1-c)。A以总概率(1-b/2)(1-c)(1-c/2)获胜,c以总概率(1-b/2)(1-c)c/2获胜。

    最后,如果B在第一轮中以B/2的概率击败A,并在第二轮中与C对决。B以总概率(B/2)B(1-c/2)/(B+c-bc)获胜,c以总概率。

    每个玩家的总获胜概率:
    PA=(1-b/2)(1-c)(1-c/2)
    PB=(1-b/2)(1-c)c/2+(b/2)b(1-c/2)/(b+c-bc)
    PC=(1-b/2)c+(1-b/2)(1-c)c/2+(b/2)c(1-b/2)/(b+c-bc)

    显示谁最有可能获胜的图表:https://goo.gl/BrYdbL网站
    谷歌电子表格:https://goo.gl/LT5GCr网站

    1. 你好,杰森,
      我不确定特鲁尔回合的逻辑。我对待“决斗”的方式和你一样——50/50先射中对方——但根据类似的逻辑,应该有可能是C在A对B的射门之前射中了A,而你似乎认为A、B完成了潜在的相互射门,然后C的子弹就来了。因此,我得到了一些不同的结果,尽管模式是相同的。

  3. Laurent,我可能遗漏了一些东西,但我确信有一个纯粹的策略解决方案,球员B和C都瞄准a,而a瞄准B和C之间更好的投掷者。假设B>C,将此策略称为BAA。

    经过一些代数运算,三者中获胜的概率(假设b>c)为:
    PA=(1-b/2)*(1-c)*(1-c/2)
    PB=b^2/2*(1-c/2)/(b+c-b*c)
    PC=(1-b/2)*c+(1-b/2)*(1-c)*c/2+(1-b2)*b*c/2/(b+c-b*c)

    为了确定BAA是否是一个均衡,每个参与者都要考虑变化是否会增加获胜的可能性。因此,A将其与CAA战略下的PA进行比较,B将其与BCA策略下的PB进行比较,C将其与BAB策略下的PC进行比较。

    这些是:
    PA(CAA)=(1-c/2)*(1-b)*(1-b/2)
    PB(BCA)=0
    PC(BAB)=b/2*c+(1-b/2)*c/2+b/2*(1-c)*c*(1-b2)/(b+c-b*c)

    前两种情况很明显是PA(BAA)>PA(CAA)和PB(BAA。

    因此,似乎没有激励任何玩家偏离纯战略BAA。我不清楚你的硬币翻转球解决方案的右上部分是如何合理的。

  4. 好吧,也许是规则解释上的不同。我假设所有球员在每一轮都同时投掷,没有时间差异。因此,例如,在我的解释中,BCA将导致B的某些消除(A以100%的准确率向B投掷,B以C投掷,C以A投掷)。根据这些规则,我认为BAA是一个纯粹的战略解决方案。根据你的解释,C可能在A有机会投掷之前就淘汰了A,所以B有机会在这种情况下获胜?

    1. 对,根据我的解释,如果玩家使用策略BCA,那么每个人都有1/6的机会
      抛出的实际顺序是(A,B,C),(A,C,B),……对于C在A抛出之前击中A的情况,则B幸存。这意味着B更有可能通过缺少C生存,这表明这种策略对B来说不是最佳的。
      我们必须看看Riddler想要什么样的解释。我真的很喜欢这些拼图,
      但我必须承认,有些问题写得不清楚,因此
      多种解释。我真的不知道如何解释这个,我看到了另一个
      人们发现了我认为同样有效的替代解释。

      1. 我用你对游戏的解释解决了这个问题,还为这个案例添加了一个动画。我认为这是最好的解释;它产生了一个具有独特纳什均衡的游戏!

  5. 劳伦特,谢谢你更新了随机球的解释。

    祝贺你们两位在本周的538 Riddler解决方案中发出呼吁!

    当做,
    杰森

    1. 谢谢,杰森。但我仍然感到奇怪的是,该专栏根据对他模糊问题的两种不同解释显示了图形,而第五专栏似乎没有意识到解决方案解决了不同的问题!
      劳伦特,像往常一样,你做得很出色,我真的很喜欢图形。

      1. 伙计,同意本周对538 Riddler的解决方案不够严格或详细。当然,洛朗的分析要完整得多,也更令人满意。

        去年我遇到了一个问题,我相当肯定这是一个错误的解决方案。试图得到认可和纠正导致了我的失败,奥利弗也没有回应。请参阅以下链接。在那之后,我觉得最好是享受挑战,但尽量不要对缺点的陈述过于挑剔。

        https://twitter.com/jason_weisman/status/921369527241363456
        https://twitter.com/jason_weisman/status/916330448137129984
        https://twitter.com/jason_weisman/status/917153789173526529

留下回复

您的电子邮件地址将不会被发布。 已标记必填字段*