海盗战利品之谜

今天的谜题是在Riddler公司博客,但它实际上是解决问题爱好者的经典之作,通常被称为盗版游戏以下是Riddler中使用的公式:

十个完美理性的海盗逻辑学家(PRPL)发现了10个(不可分割的)金币,并希望在他们之间分配战利品。

从船长到下,海盗们都有自己独特的等级。船长提出了第一个分配黄金的计划,于是海盗(包括船长)投票表决。如果至少有一半的海盗投票赞成该计划,那么该计划就会生效,黄金也会相应分配。然而,如果该计划获得的票数不到一半,船长就会被杀,二把手就会被提拔,整个过程就会重新开始。(这些PRPL叛变了。)

海盗总是按照以下规则投票,冲突中最早的规则优先:

  1. 自我保护:海盗把自己的生命看得高于一切。
  2. 贪婪:海盗寻求尽可能多的黄金。
  3. 嗜血:如果海盗对自己的生命或赏金没有威胁,他总是投票决定杀人。

在这种制度下,PRPL如何分配黄金?

额外学分:解决存在P海盗和G金币的广义问题。

以下是主要问题的解决方案:
[显示解决方案]

以下是一般情况的解决方案:
[显示解决方案]

如果你对这类问题感兴趣,我建议你试试蓝眼睛岛民,或不忠的丈夫。更多信息这里也是.

关于“海盗战利品之谜”的17点思考

  1. 还有几个想法:

    1) 如果你需要绝对多数票而不是50%的选票才能获胜,那么解决方案就大不相同了。例如,有两个海盗船长总是会死,有三个海盗船长会夺走所有的金牌。

    2) 还有其他策略需要研究。假设你是100名海盗的船长,带着20块金子。看起来你要走木板了,27名海盗也跟着你。该怎么办?你最好的办法是迅速抓起两块金子扔到海里!现在我们有2(18+2^5)=100,你没事了。绝望的人会做绝望的事。当然,如果你开始扔掉宝藏,我怀疑规则已经过时了,你无论如何都会死的。

    3) 另一个策略:假设有3个海盗和10个金币。“合乎逻辑的”解决方案是队长得到9枚金牌,#1得到1枚。但假设在船长说话之前,#1对船长大声说道:“我不会满足于一件!除非你把10件都给我,否则我会投反对票,你会死的!”如果船长提出合理的建议,#1海盗执行了他的威胁,船长就会死。为了生存,队长的首要任务,难道不是被迫提供所有10块金牌中的#1吗?但想必队长应该虚张声势,提出合乎逻辑的建议,在这一点上,#1不接受其他任何事情都是不合理的。

    1. 谢谢你的精彩评论!我特别喜欢第2项,因为它为问题增加了一个全新的层面。有兴趣进一步研究这个选项。并非所有的海盗都有扔掉一些黄金的动机,只有那些注定要失败的海盗才会这样做。

      我认为第1项可以用类似于我在帖子中提到的递归方法来解决。关于第3项,我认为事情可能会变得非常复杂,因为可能会提出各种复杂的贿赂。归根结底,对任何海盗来说,唯一100%安全的做法就是不要相信任何其他海盗!

    2. 问题3:如果我们认真对待前提,那就不会发生。如果队长提议1-0-9,#1会接受,因为另一个选择是根本不获得金牌。

    3. Wrt问题2:

      让我们添加一个额外的约束条件,使这个问题具有确定性:海盗只有在死亡的情况下才会扔掉黄金,但他能够自救。

      在这种情况下,从最初的问题可以看出,前2G+2盗版者不会扔掉任何东西。

      对于P>2G+2,设N=P-2G。这是一个价值,谋杀方必须以二倍的力量才能阻止。所以问题是,队长能通过扔掉一些金子来获得2倍的力量吗?
      扔掉一块金币会使G减少1,从而使N增加2。所以这是真的,如果N和N+2G之间有一个二次幂,或者用我们原来的术语,在P-2G和P之间,我们称之为二次幂。如果存在,船长将扔掉(P2-N)/2=(P2-P+2G)/2=G–(P-P2)/2个金币,留下(P-P2)/2个,然后像原来的问题一样接受他的提议。如果没有,结果将与原始问题中的结果相同。

      总而言之,当P>2G+2(或仅2G)时,当且仅当间隔时间内有2次幂时,队长才会活着[P-2G;P]。如果有,他将留下(P-P2)/2个硬币,并接受他的提议。如果没有,他的(及其直接继任者的)生命将和最初一样短暂而悲伤。

      1. 我认为这只是部分正确。如果$P>2G+2$,那么只有当$P-2G$是$2$的幂时,队长才是安全的。如果我们假设船长可以为了自救而扔掉黄金,那么有两种情况:

        1. 如果$P$是奇数,那么即使我们减少$G$,$P-2G$也总是奇数(并且严格大于$2$)。所以队长总是注定要失败。
        2. 如果$P$是偶数,那么其余的论点是正确的。检查的一种简单方法是查看间隔$[\log_2(P-2G),\log_2[P)]$是否包含任何整数。
  2. 回答得很好。我得到了一个类似的答案,但没有“偷看”你的,但我在谷歌上搜索“海盗分馅饼”(一个相当标准的游戏类),最终我在这里登陆,但我不想要一个破坏者。你很好地将你的解决方案隐藏在一个超链接后面,但诱惑……给我们自学者一个机会,也许等到周一再发布你的5vethirtyeight.com Riddler解决方案?与其他问题有很大联系;很有趣。优秀的博客。你很好地解决了这些谜语,但我宁愿在fivethirtyeight.com的截止日期之后阅读这些。

    1. 这是一个很好的观点,我想从现在开始我会等到周一发布我的解决方案。我认为一个很好的折衷方案是在链接后面隐藏解决方案,但我同意,点击一下可能太诱人了。

  3. 如果海盗是完全理性的,那么对于3个海盗来说,解决方案不会与2个海盗一样。由此推断,

    您有v3:[1 0 9]。然而,最后一个海盗(得到9分)知道,如果他投票杀死船长,他可以获得10枚金牌,通过投票杀死船长可以最大限度地获得金牌。第二个海盗嗜血,他投票决定杀人,因为无论哪种方式他都得不到金币,但他绝对投票决定杀人。因此,解决方案最终为[杀死0 10]。队长无能为力。

    对于v4,您有:[0 1 0 9]。但是,基于上述理由,海盗4将投票杀死,除非他获得10枚金牌。所以我得到的解决方案是[0 0 0 10],其中海盗1和海盗4投了赞成票。

    对于v5,我得到了[71110]。海盗2-4宁愿得到一些东西,而不是什么,如果他们投票杀死,因为v4是[0 0 0 10]。海盗5票赞成杀人,但人数超过其他人。

    版本6:[0 8 2 0 0 0]。海盗2和海盗3嗜血,但v5中的+1战胜了他们杀人的欲望。

    第7版:[6 1 0 0 1 1 1]。如果P5和P4知道如果他们能杀了队长,他们将获得v6并最大化他们的金牌,因此队长必须提供比v6更多的奖金才能投赞成票。因为队长的金牌最大化,所以他给其他人0分和1分。

    v8:[0 0 2 1 1 2 2 2]
    v9:[4 1 1 0 2 2 0 0 0]
    版本10:[3 0 2 2 1 0 0 1 10]

    1. 我想你可能误解了我的解决方案。我正在安排海盗从最低优先级到最高优先级队长总是排在最后。因此,当我写下:
      \开始{align}
      &\quad\text{Gold distribution}和\text{Votes}和\t需要}
      v_2&:\开始{bmatrix}0&10\结束{bmatricx}&&1\\
      v_3&:\开始{bmatrix}1&0&9\结束{bmatricx}&&2
      \结束{对齐}
      在$v2$中,船长得到10美元,第二个海盗什么也得不到。这是最理想的,因为只有队长的投票才能确保“至少一半的选票”,确保他永远不会被杀。在三名海盗的案件中,船长投票决定给自己9美元的黄金。第二个海盗不喜欢零分,所以投了反对票,但第三个海盗得到了一枚金牌,这比他投反对票时得到的零分要好,船长死了,我们只剩下两个海盗…

      1. 我还没有理解解决方案的一点:为什么v3是[10 9]而不是[0 1 9],或者类似地,为什么v3-v4序列不是[1 0 9]–>[1 0 0 9]或[0 0 1 9]?这两种情况都没有保留逻辑吗?

        1. 每个海盗都会投票支持给他们最多黄金(贪婪)的计划。如果出现平局,他们会投票支持导致死亡(嗜血)的计划。以三名海盗为例,看看排在最后的海盗。如果船长死了,我们减少到v2的情况,最后一个海盗将获得0黄金(v2的解决方案是[010])。因此,为了购买最后一个海盗的选票,我们需要向他提供至少1枚黄金。(给他0金币不会因为嗜血而动摇他)。然而,如果我们看最后第二个海盗,如果船长死了,那个海盗将获得10枚金牌。所以,再多的黄金也买不到海盗的选票。幸运的是,队长只需要一票(加上他自己的一票)就可以在v3案件中获得多数票。所以他会给最后一个海盗1金,给第二个海盗0金,并为自己保留9金。

  4. 你最后一个用红色显示已故船长的分区列表有一个问题。请注意,从2G+2开始,只有偶数个海盗一直能从提供的黄金中获利,而没有一个奇怪的海盗能通过他们的奖励计划。我们应该把它混在一起,以避免第三条规则。

    当然,问题是,这些屡次获得奖赏的偶数乐团再次出现了嗜血现象。这些级别较低的海盗都知道,他们最终会达成一项计划,让幸运的“获救船长”通过(例如P=2G+2),他们将因投票而获得一枚硬币作为奖励。因此,对于下一个最高的2^k(P=2G+4),你不能提议奖励这些海盗,因为他们已经知道他们会在下一个成功的分区中获得一枚硬币(在杀死几个船长,甚至杀死他们中的许多人以获得更高的k)。因此,没有一个预定的贿赂会成功,没有一个受贿者,所有被提供硬币的人都会投反对票!只有给他们两枚硬币,才能说服他们克服嗜血行为,但这显然不是办法(金子已经非常紧了)。幸运的是,我们知道有很多便宜的受贿者。

    因此,正确可行的提议(在P>2G+2之后)必须试图贿赂其他一无所获的人,即偶数的海盗。对于k中的每一个连续增量,继续在这些偶数/奇数低阶之间交替(仅对于2G+2^k成功的计划,因为其他“注定”的建议可能是任何东西,并且总是失败,所以是不相关的)似乎足以让他们将期望重置为零。

    另一个(也许是吹毛求疵):从下一段到最后一段提到的非唯一解决方案实际上是从P=2G+2案件开始的,因为除了偶数海盗(他们在下一轮中会得零分)之外,船长也可以给大副一枚硬币(称之为海盗P*=P-1=2G+1,为了保住他的脖子,他在下一轮也会以零结束)。

    鉴于对PRPL在不确定性下的决策有了更微妙的理解,后一个问题可能不仅仅是吹毛求疵。事实上,甚至在第一个死去的队长出现之前,就引入了非独特的可接受提议(在我们的推理中是“之前”,但在游戏假设会结束之后,尽管它实际上永远不会走那么远),结合我上面提到的第一个相当关键的问题(确保你小心不要奖励错误的海盗,因为他们悲剧地浪费了那一次偶然的生存机会),将概率推理引入了这个问题。

    警告:以下内容相当长!我需要花很多时间来彻底解释这一点,但我认为完全理解这些策略可能失败的所有微妙方式是值得的。所以,如果你当然感兴趣的话,请耐心等我一会儿(或者就别在这里读了,试着根据我到目前为止所说的自己解决问题)。提前道歉,因为我占用了这个博客读者的这么多空间和时间。

    那我们走吧。首先,注意我标记为P*的这个盗版是一个奇数盗版,但实际上是第一个满足条件2G+2^k(对于k=0)的盗版。所有其他奇数海盗都保证零币(目前),除了我们目前的船长空手而归(因此G+1海盗在这一轮中一无所获)外,还有其他G+1(包括我们的奇数P*)至少有一定几率获得硬币,此时,如果机长随机选择,概率p=G/(G+1)。请注意,将两组的总数(G+1)+(G+1。这些细节在决定哪些海盗可以为规模较大的海盗乐队提供一枚硬币时非常重要,我将在接下来展示。

    对于下一大群有可能分赃的海盗(P=2G+4,从这里开始,我将根据2G的k次幂2来命名,所以这是P(|k=2)=P(2)=2G+2^2),我们可以看到3个不同海盗群的未来前景,就通过或拒绝提案的后果而言:

    1) 如果当前的分配计划没有通过,那么肯定会死的人,在第一种情况下,只包括当前的船长和大副(称为C_1(|k=2)=2个海盗)。他们当然会投票支持这项计划,尽管他们没有得到任何支持。

    2) 那些能够在下一轮胜利中幸存下来的人(当P(1)=2G+2的海盗将分赃),但在那里可以保证零硬币。在第一个计划中,他们包括了我之前提到的相同的大部分奇数批次,总计C_2(2)=G+1(最低的G奇数加上2G+2船长代替他的P*大副)。除非给他们一枚硬币,否则他们会拒绝任何当前的提议,因为如果这个计划失败,他们似乎什么也没给,他们以后也会得到同样的结果,他们宁愿看到一些队长上阵。

    3) 那些也能幸存下来,但如果当前分区失败,至少有机会在下一个成功分区中得到一枚硬币的人。目前,这些总C_3(2)=G+1(包括我们的特殊奇数P*盗版,顺便提一下P*=P(0),所以这个伙伴是一个真正的边缘情况),他们中的每一个当前都感觉“有资格”,概率相对较高P(|k=2)=G/(G+1)(渐近但对于高G永远无法实现确定性)第1组在下一轮比赛中获得一枚硬币。

    如果给第三组的人一枚硬币(现在是有把握的,而不是不太确定的机会),他们可能也会接受当前的计划,但与第二组的人相比,他们这样做的动机要小一些。尽管如此,对于贪婪的盗版者来说,这种对担保的偏爱似乎是完全合理的,这将大大简化决定谁获得硬币的工作:只需从第2和第3组中随机挑选任何人,即从盗版号2G+2以下的任何人,与最初建议的复杂的偶数/奇数(但对于增量k而不是P)模式相反。

    然而,他们是海盗,如果他们在冒相当大的风险时感到很自在,那也不会太不合理。他们似乎不敢对G/(G+1)概率下注(如果足够接近1或谁知道,甚至1/2都可能触发他们的赌博倾向),并冒着被挑出来在下一次可行的拆分(G+1海盗)中拿不到硬币的风险,冒着这样的风险,也许值得一睹队长们的风采。我认为,在“随机选择”的贿赂中,至少有一种(记住这是我们候选人库中的一半)可能是这些风险寻求者之一,如果只有一种人决定拒绝贿赂,那么第一组人就会死亡。

    因此,船长最好决定谁来“贿赂他们的选票”,以避开第3组,并坚持第2组的低期望值(显然,永远不要向第1组提供硬币,因为这些选票是免费的)。这种“寻求风险”的行为可以被描述为一种更微妙的规则,即“嗜血情绪在获得未来硬币的概率p>1/2以上,或者在未来几轮中未命名的预期价值超过当前提供硬币数量的类似百分比p>50%”或诸如此类的规则。

    另一方面,也许他们太贪婪了(到了吝啬的地步),他们会接受任何小的(但有把握的)报价,而不是更高的(虽然不确定)期望在未来的分割中获得黄金(他们推论为“手中的鸟”)。然而,这种“风险规避”在分析游戏规则时,在任何最优方案中都不存在可能性(除了那些在投票后拥有多余黄金的船长之外,没有人会期望得到比一枚硬币更多的钱,但如果我们要求提案以超过50%的投票通过,那么这种可能性确实会出现,但这是一个“需要解决的另一个难题”)。

    在任何情况下,都有G币可供赠送,有足够的海盗可供从第二组中挑选(刚开始是紧G+1,但我们将看看如何在更高的k中增加这个松弛度)。因此,一名船长对任何寻求风险、嗜血、级别较低的同伴保持警惕,他可以安全地贿赂所有他需要的人,只需在第二组中选择除一个以外的所有人(在我们目前的情况下,k=2)。在当前计划中,他们每人得到一枚硬币的概率再次是G/(G+1)。

    此外,因为对于更有利可图的战利品来说,这个p(|k99%将在下一次被创造出来)实际上并不是这样的(正如本文在其他方面相当彻底的分析中所发生的那样)。尽管概率具有无限深的合理性,但它往往会欺骗理性的代理人,而这种“奇数/偶数现在增加k而不是P,但等待P*是奇数但特殊的”业务可能会变得棘手。

    因此,将(指数递增的数字)添加到队列2池中,队长从中采样硬币接收器,向每个人发出信号,告诉他们应该如何不断更新(降低)他们对相对于战利品大小的越来越大的波段的期望,直到只有少数接近极限的情况(这更容易推理)实际上涉及到潜在的“有资格”的海盗,他们无法用一枚硬币成功贿赂,当复杂性真正开始时,尽可能多地留下错误的空间。

    因此,我将尝试概括这些队列大小、概率和期望的计算,首先是下一个更大的成功方案,其中P(3)=2G-8海盗可以分割战利品,然后通过归纳得出任何更高的k和P(k)=2G-2^k。我们首先注意到,一定会发生队列转换:旧队列2中这群可能被贿赂的海盗,有机会获得硬币,现在就构成了新队列3(他们现在可能有资格,用一枚硬币更难说服),而旧队列3中的海盗现在保证不会得到硬币,所以他们将加入新的第二队列。而那些在旧队列1中的人,正如我们推论的那样,也会落入新队列2中,以进一步稀释他们的期望,因为这些也被保证为零硬币(但他们现在的生活是安全的),并且容易被一枚硬币贿赂。因此,我们在新队列中的总数将是:

    1) C_1(3)=4海盗(k=3),我们将其概括为海盗数量的增加,所有海盗都是新“注定”的船长:
    C_1(k)=P(k)–P(k-1)
    =2G+2^k–(2G+2^(k-1))
    =2^(k-1)*(2-1)
    =2^(k-1)

    2) C_2(3)=G+3,当试图推广时(例如,通过添加之前的队列1和3,或作为总P(k)-C_1(k)/C_3(k
    C_2(k+1)=C_2(k-1)+2^k
    C_2(0)=G和C_2(1)=G+1

    我无法解决复发问题,但进一步的研究揭示了这些(对我来说)非常酷的关系:
    C_2(k)=G+A(k),其中A(0)=0,A(1)=1,
    A(k)=2^(k-1)–A(k-1)
    =2A(k-1)–(-1)^k
    =(2^k–(-1)^k)/3
    因此,|3A(k)-2^k|=1,将这些数字增加三倍,使您接近2的幂。

    (见雅各布斯塔尔数http://en.wikipedia.org/wiki/Jacobsthal_numberhttp://oeis.org/A001045属性和关系的惊人列表)

    3) C_3(3)=G+1,并概括为前一队列2:
    C_3(k)=G+A(k-1)[来自C_2(k-1
    p(3)=G/C_3(3)=G/(G+1)“权利”的概率,并推广为:
    p(k)=G/C_3(k)
    =G/(G+A(k-1))[见上文2)]

    我们可以检查递归公式是否给出了k=4时的预期结果:
    P(4)=2G+2^4=2G+16
    C_1(4)=2^3=8
    C_2(4)=G+(2^4-1)/3=G+5
    C_3(4)=G+(2^3+1)/3=G+3

    使用应用于p(k)上的A(k-1)的近似值可以得到:

    p(k)=G/(G+2^(k-1)/3)
    1/p=2^(k-1)/3G+1
    2^(k-1)=3G(1/p-1)
    =3G(1-p)/p

    还有一些海盗P_min,他们不太“有资格”接受高于一枚硬币的贿赂(P=1/2,(1-P)/P=1):

    P_最小值=2G+2^k
    =2(G+2^(k-1))
    =2(G+3G)
    =8G

    好吧,这是一个很好且简单的方法,可以得到一个大概的数字,让这些吵闹的伴侣变得更加顺从。高层已经受够了试图保护自己的利益,不需要这种“我们要求的不仅仅是一枚硬币”的态度。大约80名海盗才能获得10枚金币的战利品。或者(大致)八分之一的战利品。愿意相信他们75%的权利?上述准则得出P_min=4G。海盗的数量只有黄金的3倍?然后,每个人都必须密切关注谁应该和不应该在每一点上受贿,强烈依赖交替队列的策略,因为大约三分之一的人会觉得在任何给定的时间大约有86%的人有权获得一枚硬币,我敢打赌,如果提供这种廉价的贿赂,他们中的许多人都会拒绝。

    所以我会把它留在那里。再次为冗长的评论道歉。希望它值得读者阅读。

    1. 谢谢你的评论,你确实是对的。在考虑2G+4$案件时,盗版者将通过将其与2G+2$可能赢得的结果进行比较来评估提案,因为2G+3$案件无论提出什么建议都会失败。我更新了我的解决方案,以反映您评论的第一部分。

      你的评论的第二部分非常有趣,为这个问题带来了一个全新的维度。也许值得单独写一篇关于它的文章!

      1. 感谢您抽出时间阅读整个评论。当我不断地写作时,我一直告诉自己“不,这已经太长了,没有人会读任何一本了,停下来,停下来!”哈哈,然后又有一个很酷的想法出现了,我不得不把它包括在内。我甚至担心它不会通过审核,但我可以试着减少它。

        但你来了,不仅阅读了所有内容,而且已经将其中的一些内容纳入了文章中,你认为其他想法可能值得一篇完整的博客文章。那太好了!很高兴我能贡献一些有价值的东西。

        所以我重新阅读了我的评论,注意到有几个段落被破坏了,所以在这里它们被恢复了。

        _____________

        此外,由于对于更有利可图的战利品来说,这个p(|k=1或2)一开始就非常确定(例如,对于g=83,在168号及以上船长提出的计划中,有84名海盗有99%的机会获得硬币),似乎高级船长有兴趣(170、174、182、198等等,或者想象一下,所有海盗都需要复杂的思维过程来完成2G+2^8=422的计划)尽可能地降低这种期望,通过不断增加随机挑选的人数,他们可以很容易地做到这一点,将每个队列1添加到下一个队列2中,从中选择将获得奖励的G。请注意,本文中建议的提案和我最初介绍的两项修正案中均未出现这种期望淡化的情况;概率始终保持在99%左右,任何人的一个错误都可能是致命的。

        我在这里提出的风险是,由于引入了概率思维,并且在我们的边缘案例P*中破坏了最初简单的奇偶模式,似乎更有可能的是,一个或多个稍微分心的海盗,或者过度冒险的人,或者嗜血成性的人,在任何一步都可能犯下微妙的错误,并认为他们是“有资格”的人之一(下一步大约99%会被创造出来),而事实并非如此(正如文章在其他方面相当彻底的分析中所发生的那样)。尽管概率具有无限深的合理性,但它往往会欺骗理性的代理人,这种“奇数/偶数现在增加k而不是P,但等待P*是奇数但特殊的”业务可能会变得棘手。

        _____________

    2. 在我的长篇评论的最后一段,我想说:

      “大约80名海盗才能获得10枚金币的战利品。一般来说,这大约是战利品的八分之一。”

      最后一句显然是错误的。我的意思是说“掠夺了八分之一的海盗”。另一种说法是“当每个海盗的硬币比例为1/8时”。

      顺便说一下,P、G和概率之间的一般关系可以用每枚硬币的盗版率r=P/G来表示,如下所示:

      P=2G(1+3(1-P)/P)
      r=P/G=2+6(1/P-1)
      r=6/p-4

      或者如果我们需要逆:p=6/(r+4)。

留下回复

您的电子邮件地址将不会被发布。 已标记必填字段*