选张卡片！

这个谜题是一种纸牌游戏，其目标是找到最大的牌。

从编号为1到100的100张牌组成的洗牌组中，你将获得面朝下的10张牌。你把牌一张一张地翻过来。每张牌之后，你必须决定是否结束游戏。如果你以手中最高的一张牌结束比赛，你就赢了；否则，你就输了。

优化您获胜机会的策略是什么？当牌组和手的尺寸改变时，策略是如何改变的？

这是我的解决方案：
[显示解决方案]

近似解决方案

假设这副牌中有$n$张牌，我们从这副牌上得到$k$张牌。每次翻牌时，我们必须决定是继续玩还是停止。假设我们已经翻阅了$m$张卡片，而迄今为止翻阅的最大一张卡片的价值为$a$。一些快速观察：

如果我们翻的最后一张牌的价值小于$a$，那么我们显然必须继续翻牌，因为如果我们现在停止玩，我们肯定会输。
假设我们翻转的最后一张卡的值最大（$a$），我们必须评估剩余的$k-m$卡每个都小于$a$的概率（换句话说，$a$获胜的概率）。我们应该将这个概率与如果我们继续比赛我们将获胜的概率进行比较。以最高者为准，将决定最佳行动方案。

一种可能的启发式决策是，如果当前牌获胜的概率大于1/2美元，则停止，否则继续玩。这是一个次优策略，因为我们获胜的机会可能是甚至更少如果我们继续玩！换言之，如果我们现在停止比赛，我们可能有49%的获胜机会，但如果我们继续比赛，只有45%的获胜机会；在这种情况下，我们现在应该停下来减少损失。这就是说，这个次优策略与最优策略非常接近（而且很容易计算！）所以让我们来计算一下。

到目前为止，我们翻转过的每张$m$卡都是不同的，并且小于或等于$a$。如果当前卡$a$是优胜者，则剩余的$k-m$卡必须全部从小于或等于$a$的$a-m$卡中选择。这可以通过$a-m\选择k-m$方式完成。总的来说，有$n-m\choose-k-m$种选择剩余卡片的方法。因此，如果
\[
\压裂{a-m\选择k-m}{n-m\选择k-m}\ge\压裂{1}{2}
\]显然，这将满足$a$足够大的要求，所以我们的最佳决策规则是阈值规则。$a$的阈值没有封闭式表达式，但数值计算很简单。下面是$n=100$，$k=10$情况下的近似决策规则图。

下角的三角形白色区域对应于情况$a<m$，这是不可能发生的，因为$a$必须是迄今为止看到的最大数字，并且所有数字都必须是不同的。

精确解决方案

为了得到精确的解决方案，我们将使用动态规划.让牌编号为$\{1,2，\dots，n\}$，并让$k$为游戏开始时面朝下的牌的数量。一般来说，人们可能会认为最佳策略取决于迄今为止所有卡片的个人价值。事实并非如此。事实证明，最佳策略仅取决于：

到目前为止，我们已经看到了多少张卡片（我们称之为$m$）
到目前为止，我们看到的价值最高的卡片（我们称之为$a$）
上一张交出的卡片是否是迄今为止最大的。

我们将定义两个函数，$V^\text{lo}_m（a） $和$V^\text{hi}米（a）美元，以记录在我们提交的最新牌分别为低或高的情况下赢得游戏的概率。

基本情况：假设$m=k$，那么我们刚刚翻过最后一张卡片。比赛自动结束，我们没有决定权。如果我们翻过来的牌是编号最高的牌，我们就赢了。换句话说：
\[
\开始{对齐}
V^\text（V ^\text）{lo}k（_k）（a） &=0\\
V^\text（V ^\text）{你好}（_k）（a） &=1
\结束{aligned}\qquad\text{for}a=1，\点，n
\]

递归：现在假设我们进入游戏$m$步。让我们从一张低翻牌的情况开始。在这里，如果我们停止比赛，我们肯定会输。所以我们必须继续比赛。我们假设下一张翻过的卡片是S$中的$y\。这里，$S\subseteq\{1，\dots，n\}$是我们还没有看到的一组卡片。请注意$|S|=n-m$，因为到目前为止我们已经翻阅了$m$张卡片。这些剩余的$n-m$卡中的任何一张都可以以相同的概率翻转到下一张。让我们分别处理$y<a$和$y>a$这两种情况：
\开始{align}
V^\text（V ^\text）{lo}_m（a） &=\frac{1}{n-m}\biggl（在S，\，y<a}V^\text中为sum_{y\{lo}_{m+1}（a）+sum_{y\在S，\，y>a}V^\text中{你好}_{m+1}（y）\biggr）\\
&=\压裂{1}{n-m}\biggl（（a-m）V^\text{lo}_{m+1}（a）+\sum_{y=a+1}^nV^\text{你好}_{m+1}（y）\biggr）
\结束{align}输入最后一步，我们使用了一个事实，即$V^\text{lo}$sum中正好有$a-m$项，这与$y$无关。在$V^\text{hi}$sum中，我们对所有大于$a$的值进行求和，但尚未使用此类值。

对于高翻页卡，我们可以选择停止游戏或继续游戏。如果我们停止游戏，如果剩下的$k-m$卡刚好都小于我们目前的最高卡$a$，我们就会赢。有$a-m$张卡满足此属性，总共剩下$n-m$张，因此获胜的概率是${a-m\choose-k-m}/{n-m\chooke-k-m{$。如果我们决定继续比赛，我们得到的答案与低水平情况相同。因此，我们的递归是：
\[
V^\text（V ^\text）{hi}米（a） =\max\biggl\{\下大括号{\frac{{a-m\选择k-m}}{n-m\选择k-m}}}_{text{STOP}}，\，
\下大括号{V^\text{lo}_m（a） }_{\text{PLAY}}\biggr\}\qquad\text{表示}a=1，\点，n
\]在这一点上，不借助于数值计算就不可能继续进行下去。好消息是，这些递归比较容易用数字表示；我们可以将所有相关概率存储在两个矩阵$V^\text{lo}，V^\text{hi}\in\mathbb{R}^{k\timesn}$中，并且可以计算$\mathcal{O}（n^2k）$中的所有值。

下面是$n=100$，$k=10$情况下的最优决策规则图。

正如我们所看到的，这个图与近似规则非常相似。以下是用于比较的阈值表：

卡片翻转	近似阈值	最佳阈值
1	93	93
2	93	92
三	92	91
4	90	89
5	88	87
6	86	84
7	82	80
8	74	72
9	55	55
10	10	10

这意味着，如果我们的第九张牌是$55$或更高，我们应该停止玩。请注意，如果我们进入第10回合，而我们最后一张翻转的牌仍然是竞争者（即我们迄今为止见过的最大的一张），那么这张牌的价值不能低于10美元，我们就会自动获胜。

获胜概率

那么我们如何计算实际的获胜概率呢？我们已经有了！如果我们一直递归到$m=1$，那么$V^\text{hi}_1（b） $告诉我们，如果我们翻出的第一张牌是$b$（当然，这是我们的最高牌），那么我们获胜的概率是多少。由于所有卡片都很可能是第一张卡片，因此我们有：

$\显示样式
\mathbb{P}（\text{winting}）=\frac{1}{n}\sum_{b=1}^nV_1^\text{hi}（b）=V_0^\text}hi}
$

对于$n=100$和$k=10$的情况，获胜概率为62.19%。

限制案例

我们可以很容易地计算出如果我们添加更多卡片会发生什么。让我们修正$k=10$，然后尝试$n=1000$。

正如我们所看到的，当我们使$n$变大时，事情看起来并没有太大的不同。我们可以通过将$a$作为$n$的某个固定分数并使用我们的近似策略而不是最佳策略来近似这个极限形状：
\开始{align}
\压裂{a-m\选择k-m}{n-m\选择k-m}
=\prod_{j=1}^{k-m}\frac{a-m+1-j}{n-m+1-j}
\近似\prod_{j=1}^{k-m}\frac{a}{n}
=\左（\压裂{a}{n}\右）^{k-m}
\结束{align}因此阈值（当该概率达到$1/2$时）发生在：
\[
近似n，2^{-\frac{1}{k-m}}
\]我们可以将极限情况公式与实际公式叠加，以查看它们的匹配程度。以下是一个$n=10000$和$k=40$的示例：

这是一个很好的匹配，最佳策略的阈值略低于最佳策略。增加$k$也很简单，只需将上述图片向右移动即可！

注：如果天真地计算二项系数的比率可能会很困难，因为它涉及两个非常大的数字的比率。我在绘制绘图时使用的方法是将表达式转换为乘积：
\[
\压裂{a-m\选择k-m}{n-m\选择k-m}
=\prod_{j=1}^{k-m}\frac{a-m+1-j}{n-m+1-j}
\]然后计算乘积的每个项并将它们相乘。

关于“选张卡片！”的17个想法

盖伊·摩尔 说：

2017年4月24日下午1:14

劳伦特，你好，
这与我发现的策略不同。我不明白你是如何达到这样一个标准的：获胜概率为1/2或更高意味着你应该停止比赛，而小于1/2意味着你应继续比赛。
我发现如果我不停下来，人们应该计算获胜的概率，我将其写为
P（n，k，m，a）
（在抽到k张牌的n牌游戏中，当第m张牌被翻转并且到目前为止的最大值是a时，剩余的k-m张牌的最佳策略将导致获胜的概率）。
然后我必须把你计算正确的，如果我停下来的话，获胜的机会与P（n，k，m，a）进行比较。在某些情况下，P（..）在1/2以下就足够了，即使赢的机会略低于1/2，你也应该停下来。我的（效率极低）代码位于
https://theorie.ikp.physik.tu-darmstadt.de/qcd/ncards.c
看看它是否给出了与您的方法稍有不同的获胜概率。
盖·摩尔

答复
1. 马修·莫纳汉 说：
  
  2017年4月25日凌晨3:04
  
  我真的很喜欢阅读你的解决方案。像往常一样，我离开时会考虑一些我没有考虑过的事情。
  
  我同意盖·摩尔的观点。考虑n=50和k=4的情况。如果第一张牌是40，并且您结束游戏，则获胜概率为Comb（39,3）/Comb（49,3）=0.4960。由于这个值小于0.5，按照你的逻辑，你应该继续游戏。
  
  但如果你继续比赛，你获胜的概率实际上会降低。如果你的第一张牌是40，那么赢的方式总数是sum（Perm（i-2,2），i，41,50）+39*sum（Perm（i-3,1），i、41,50，）+39*18*10=49965。获胜概率为49965/P（49,3）=0.4520。
  
  经验上，0.5标准是解决方案的一个很好的近似值，我通过模拟得出了类似的阈值。我认为你需要比较如果你停止游戏的获胜概率和如果你继续游戏的获胜几率，以获得准确的解决方案。
  
  答复
  1. 劳伦特 说：
    
    2017年4月25日上午10:02
    
    谢谢盖伊和马修的评论。你们都对了。我说得对，如果P>1/2，你应该停下来，但我草率地得出结论，如果P<1/2，你就应该继续比赛。我会对此进行更多思考，并希望很快修改我的解决方案。
    
    答复
    1. 劳伦特 说：
      
      2017年4月26日凌晨4:27
      
      我更新了我的博客帖子。我现在大致准确地计算出了解，并将两者进行了比较。事实证明，1/2的启发式非常好！感谢所有反馈！
      
      编辑：谢谢Gabe！我做了你建议的修改，并对文本进行了编辑以澄清。
      
      答复
      1. 盖布·伯恩斯 说：
        
        2017年4月27日12:32 pm
        
        正如您（正确地）在之前的评论中所指出的，如果p>1/2，您应该始终停止，有时即使p<1/2也应该停止。然而，解决方案的第三段内容如下：
        
        “（1/2启发式）结果是一个次优策略，因为我们获胜的机会可能是甚至更大如果我们继续比赛！"
        
        这似乎意味着相反的主张：如果p<1/2，你应该一直继续，有时甚至p>1/2。如果你把它改为“……我们失去……的机会”或“……可能甚至更少……”（当然不是两者都有），这是正确的。
    2. 马修·莫纳汉 说：
      
      2017年4月26日上午6:16
      
      我找到了一个很容易计算的公式来计算如果你继续下去的话获胜概率：
      
      P（a，m，k，n）=和[prod[j，{j，a-i+2，a-m}]*和[Perm（j-i，k-i），{j、a+1，n}]，{i，m+1，k}]/Perm（n-m，k-m）
      
      这是我是如何得出这个公式的。如果你在第七张牌后继续打牌，你可以通过k-m方式获胜：
      
      1.）m+1卡在a+1和n之间，你停下来，所有其他卡都更低。有可能发生这种情况的Perm（a+1-m-1，k-m-1）+…+Perm（n-m-1，k-m-1）。
      2.）第m+1张牌小于a，第m+2张牌介于a+1和n之间，你停下来，所有其他牌都更低。有（a-m）*（Perm（a+1-m-2，k-m-2）+…+Perm（n-m-2，k-m-2））可能发生这种情况。
      3.）第m+1和m+2张牌小于a，第m+3张牌介于a+1和n之间，你停下，所有其他牌都更低。有（a-m）*（a-m-1）*（Perm（a+1-m-3，k-m-3）+…+Perm（n-m-3，k-m-2））可能发生这种情况。
      4.）等。
      
      该公式将所有这些事件相加，然后除以手排列的数量，以计算获胜概率。当停止获胜的概率小于继续获胜的概率时，就会出现阈值。使用这个公式和你关于如果你停下来获胜概率的公式，我得出了与你在修改后的帖子中所做的完全相同的阈值（这太棒了！）。
      
      答复
      1. 劳伦特 说：
        
        2017年4月27日上午10:30
        
        我不太明白——你如何解释停下来和不停下来的区别？似乎在1.）中，你数一数下一张翻过的牌是赢家的方式。但是，如果你也决定在这一点上停下来，你不应该只计算这些案例吗？决策规则不应该在这里发挥作用吗？
        
        例如，如果第（m+1）张牌大于a，我可能会赢，但无论如何我都会继续玩，然后第（m+2）张牌更大，我停下来，所有后续的牌都更小。获胜的概率应该取决于我用来决定何时停止的规则，不是吗？
      2. 马修·莫纳汉 说：
        
        2017年4月28日凌晨2:57
        
        你说得很好：“例如，如果（m+1）第一张牌大于a，我可能会赢，但我还是继续玩，然后（m+2）第二张牌更大，我停下来，所有后续的牌都更小。”
        
        考虑n=100和k=10以及m=1的情况。假设我已经使用了我将要提出的论点，排除100到94作为最佳阈值，我想测试93。直观地说，随着牌数的增加，停止阈值将降低。因此，如果第一张牌是93，我继续玩，则所有后续阈值必须≤94。因此，如果我在第二张牌上得到更高的牌（94到100），我必须停止玩，因为第二张卡将等于或超过第二个阈值。我没有选择继续打牌并在稍后获得更高的牌。接下来的八张牌都必须低于第二张才能赢。类似地，如果第二张牌较低（1到92），第三张牌较高（94到100），则第三张卡将超过第三个阈值，我将不得不停下来，并希望接下来的七张牌更低。等等…
      3. 劳伦特 说：
        
        2017年4月28日上午11:00
        
        仅仅因为我一直在比赛，这并不意味着我当前的数字正好处于阈值……例如，假设你已经确定m=1,2,3,4,5的阈值为：
        90、80、70、60、50、0（当然，这些不是真正的阈值）。
        现在假设翻转的卡片是：
        5, 25, 20, 32, 62, 55
        然后，门槛规则会让我继续比赛，直到我达到62岁，在这一点上我会停下来，因为62>50。在这个例子中，我赢得了比赛。根据你之前的帖子，这个案例并不是一种可能的获胜方式。翻开第一张卡片后，我得了5分。第二张牌的价值更大，但我没有停下来。事实上，“a”改为25，然后改为32，再改为62，这时我终于停了下来。
      4. 马修·莫纳汉 说：
        
        2017年4月28日下午6:36
        
        是的，我认为我没有很好地解释自己……或者我的逻辑肯定有缺陷🙂
        
        出于好奇，你能检查一下对于某些任意情况，我们是否达到了完全相同的阈值吗？例如，当n=937和k=23时，我得到以下阈值：905、903、902、900、898、895、893、890、887、883、879、874、868、860、852、840、826、806、777、732、654、480
        
        感谢所有的回复，值得一提的是，这里有一个到我的Matlab代码的链接。
        
        https://www.dropbox.com/s/u6b7adc614p99yt/liger.m？dl=0
      5. 劳伦特 说：
        
        2017年4月29日12:19 pm
        
        我得到了与你在n=937，k=23的情况下得到的阈值规则完全相同的阈值规则。我一定错过了什么，因为你似乎没有统计所有可能的病例……我们可以再试一次吗？对于n=25，k=13，我得到：24，24，24。
      6. 马修·莫纳汉 说：
        
        2017年5月1日凌晨2:52
        
        我得到了与你完全相同的阈值。让我再试一次：
        
        对于n=100和k=10，假设第一个阈值为93。这意味着在93岁时停下来获胜的概率大于在93岁比赛获胜的概率。数学上来说：P_stop（n=100，k=10，m=1，a=93）>P_play（100,10,1,93）。为了紧凑，我将其写为P_stop（93）>P_play（93）。这也意味着P_play（92）>P_stop（92）。换言之，92岁比赛比停下来要好。
        
        我们同意P_stop（92）=C（92-1，10-1）/C（100-1,10-1）=0.4528。但是P_play（92）呢？由于我们正好低于第一个阈值，并且我们知道所有后续阈值都将≤93，因此任何未来的牌>92都将迫使我们停止游戏。获胜的唯一方法是得到正好一张大于92的牌，停下来，希望所有其他牌都更低。使用我之前发布的公式，P_play（92）=0.4659。实际上，P_play（92）>P_stop（92）。
        
        我们还必须检查P_stop（93）>P_play（93）。果然，P_stop（93）=0.5019，P_play（93）=0.4346。由于最佳策略的转换发生在92到93之间，因此93必须是阈值。
        
        简而言之，这是我的方法。我的代码将搜索满足P_stop（a）>P_play（a）和P_play。
赫克托·佩福 说：

2017年4月26日12:22 pm

做得很好。我也做了类似的事(https://hecorpefo.github.io/2017-04-22-highest-card/)这将产生与您的解决方案相同的计算获胜概率和阈值。然而，令人沮丧的是，我的蒙特卡洛模拟使用这些阈值得出的获胜概率较低，约为0.595。那么，在某处……可能在模拟人生中发生了什么？但这很简单。

https://github.com/hectorpefo/hectorpefo.github.io/blob/master/_includes/PickACard538.py

答复
1. 赫克托·佩福 说：
  
  2017年4月26日下午1:55
  
  不要介意；西姆确实有错！
  
  答复
马修·莫纳汉 说：

2017年4月27日12:49 am

很抱歉在你的评论区发垃圾邮件，但我找到了n接近无穷大时阈值的精确分析表达式。对于无限数量的卡，让卡值的范围从[0,1]开始。定义q=k-m，并将x作为阈值，作为q的函数。阈值是以下问题的解决方案：

z（q）/q！*x^q–总和[x^（q-i）/i，{i，1，q}]=0，其中z（1）=2，z（i）=i*z（i-1）+（i-1！

第一对阈值为：0.50000、0.68990、0.77585、0.82459、0.85595…
当n>10000时，这些阈值与阈值很好地对齐（精度为3-4位数）。

答复
斯蒂芬·梅斯金 说：

2017年4月28日下午2:55

劳伦特和赫克托，
近似答案和“最佳”答案之间的差异很小。你有没有通过模拟测试过它们（以及一些介于两者之间的可能性）。我可以试试，但我并没有准备好这么容易。

答复
亚力山大 说：

2017年5月16日12:16 am

你好，劳伦特！！
希望一切都好。我真的很喜欢阅读你的解决方案。递归是我最喜欢的主题之一，我在阅读那个博客时发现它非常有趣。
谢谢。

答复

近似解决方案

精确解决方案

获胜概率

限制案例

关于“选张卡片！”的17个想法

留下回复取消回复