幸运的德比-书证

本着肯塔基州德比的精神谜题是关于一种特殊类型的赛马。

号角响起，20匹马向第一届年度幸运赛马会的出发门驶去。这些马都是在神秘的谜语人马厩训练的，很特别。每一秒，每一匹经过Riddler训练的马都要迈一步。每一步正好一米长。但这些马表现出的精确性，它们缺乏方向感。大多数时候，他们的步伐是向前的（朝向终点线），但其余时间他们是向后的（远离终点线）。作为Lucky Derby的狂热粉丝，您对这20位参赛者进行了详尽的研究。你知道，一号马前进52%，二号马54%，三号马56%，以此类推，直到最喜欢的小雌马，二十号马，90%的时间都在前进。马步是相互独立的，终点线距离起点200米。

阻止这场比赛并下注！换言之，每匹马获胜的几率是多少（百分之一是好的）？

这是我的完整推导（长！）：
[显示解决方案]

让我们看看一匹特殊的马。每一步，假设它以概率$q>\frac{1}{2}$向前移动，或以概率$1-q$向后移动。马从位置$0$开始，我们想知道它以$2k$的步幅到达位置$2n$的概率。$2$因子的原因是，要达到偶数位置（如问题陈述中的$200$），马必须采取偶数步数。我们把这个概率称为$P（n，k，q）$。

这种情况称为一维随机游走，过去处理类似想法的帖子包括致命的棋盘游戏和赌徒的废墟然而，这个问题有点不同，因为我们关心所需移动次数的分布（不仅仅是预期的移动次数）。

回到手头的任务：确定$P（n，k，q）$。如果我们在$2k$的移动中达到$2n$的位置，那么很明显我们有$k\gen$。接下来，我们可以推断，我们必须向前移动$（k+n）$次，向后移动$（k-n）$倍。发生这种情况的概率是$q^{n+k}（1-q）^{n-k}$。这里最棘手的部分是处理秩序我们采取步骤。我们采取的最后一步必须始终向前，因此我们将限制注意力安排剩余的2k-1$步。总共有2k-1美元\choose k-n$种方法可以做到这一点，但这不是我们要找的数字！其中一些路径将提前到达$2n$，因此我们将计算这些路径并减去它们。

我们正在计算的数量与加泰罗尼亚数字，我们可以借用类似的证明技术（即安德雷反射法)从而得出解决方案。这里有一个论点：想象这条路是一条“山脉”，每一个2k-1$的台阶都是向右移动，或者向上或向下移动，这取决于台阶是向前还是向后移动。下图显示了$n=2$和$k=5$的有效路径。请注意，我们可以消极对待！

我们希望排除在早些时候达到$n$的“坏路径”。考虑出现这种情况的第一个点，并反映关于行$y=2n$的路径的其余部分。这将导致一条新路径，该路径具有$（k+n）$向前步骤、$（k-n-1）$向后步骤，并以$2n+1$而不是$2n-1$结束。有关反射方法的说明，请参见下图。

坏路径和长度为$2k-1$且达到$2n+1$的无约束路径之间存在一对一的对应关系。因此，有效路径的总数（总路径减去坏路径）由下式给出：
\[
{2k-1 \选择k-n}-{2k-1\选择k-n-1}=\压裂{n}{k}{2k\选择k-n}
\]简化如下：(这些身份)，但也可以使用代数轻松推导。综上所述，一匹马以2k$的步幅首次达到2n$的概率由以下公式给出：

$\显示样式
P（n，k，q）=\frac{n}{k}{2k\选择k-n}q^{k+n}（1-q）^{k-n}，\quad\text{表示}k=n，n+1，\dots
$

我们可以为我们的利息情况绘制分布图，即$n=100$，$q$从$0.52$（对于马$1$）到$0.90$（对于马$20$）不等。以下是一些马的分布图：

正如我们所看到的，这些分布是正态分布到非常好的近似值。尽管它们具有操作表达式的挑战性，但这项任务并不超出Mathematica的能力！事实上，我们可以验证$P$是一个合法的概率质量函数，并且我们还可以计算它在$\tfrac{1}{2}情况下的均值和方差：
\开始{align}
\sum_{k=n}^\infty P（n，k，q）&=1&\text{（和为1）}\\
\sum_{k=n}^\infty k\，P（n，k，q）&=\tfrac{n}{2q-1}&&\text{（计算平均值）}\\
\sum_{k=n}^\infty\bigl（k-\tfrac{n}{2q-1}\bigr）^2P（n，k，q）&=\tfrac[2nq（1-q）}{（2q-1）^3}&\text{（计算方差）}
\结束{align}此处是一些马的平均值和标准偏差：
\开始{align}
\文本｛Horse 4｝&大约1250 \ pm 218\\
\文本{马8}&\约625\pm 74\\
\文本{马12}&\约417\pm 37\\
\文本{马16}&\约313\pm 21\\
\文本{马20}&\约250\pm 12
\结束{对齐}注：我们必须将上述公式的平均值和标准偏差加倍，因为这些公式跳过奇数长度（这是不可能的）。在进行连续近似时，我们希望填充这些空格！

我们马上注意到的一件事是，分布是非常分离的（这是对数刻度！）。唯一有可能击败20匹马的马是紧随其后的马。让我们再按线性比例绘制一次分布图，但仅限于顶级马匹：

如果马$i$以$h_i$步完成，则计算马$i$获胜的概率相当于找到所有$i\nej$的$h_i>h_j$的概率。我们可以将其近似为：
\开始{align}
\mathbb{P}（h_i>h_j\，\对于所有i\ne j）
&\近似值\int_{-\infty}^\infty \mathbb{P}（h_i=x）\prod_{j\nei}\mathbb{P}（h_j>x）\，\mathrm{d}x\\
&=\int_｛-\infty｝^\infty \frac｛1｝｛\sigma_i｝\varphi_i（z_i）\prod_｛j\ne i｝\left（1-\Phi（z_j）\right）\，\mathrm｛d｝x\\
\结束{align}其中$\varphi$和$\Phi$是标准的概率密度（pdf）和累积分布（cdf）正态分布$zk=\tfrac{x-\muk}{\sigmak}$是为$k^\text{th}$horse计算的标准正常偏差（$\muk$和$\sigma k$是前面计算的平均值和标准偏差）。

这是一个非常复杂的积分，它不存在封闭解，所以我们必须用数值计算它。关于解决方案，请继续阅读！

对于tl；博士，答案是：
[显示解决方案]

马的编号	赢得比赛的可能性
20	71.27%
19	21.54%
18	5.605%
17	1.268%
16	0.2595%
15	0.05085%
14	0.01018%
13	0.002212%

关于“幸运德比”的7点思考

劳伦特，你好，
这是一个非常漂亮的方法。但这并没有解释为什么会出现4.394%的平局。
我查阅了赛马规则，N匹马之间的平局被视为每匹马获胜的1/N。这样处理关系，并执行离散福克-普朗克方程，计算每匹马在每一步的概率随时间的变化，我得到了稍微不同的结果：
马20，72.394775%
马19，21.69022%
马18，4.97523%
马17，0.832475%
马16，0.0986%
…马1，1.87X10^{-33}%
看见http://theorie.ikp.physik.tu-darmstadt.de/qcd/horse.c

答复

麦克斯特朗 说：

2017年5月8日上午9:19

值得一提的是，我的蒙特卡洛模拟（Monte Carlo simulation），它完全按照你描述的那样处理关系，Guy，给出了与你的分析方法几乎完全相同的概率。很不错的！

答复
1. 奥尔登·斯托 说：
  
  2017年5月16日晚上8:15
  
  你好，迈克，
  
  在你的蒙特卡洛方法中，你是如何准确地模拟出其中一匹马（使用盖伊的符号）以1-15获胜的罕见事件的？
  
  我进行了一次天真的模拟，很快意识到我无法准确区分不寻常的马获胜的概率和0。
  
  谢谢！
  
  –奥尔登·斯托
  
  答复

提出公式的另一种方法是认识到最后两个步骤必须向前推进。因此，其他2k-2步骤必须是向前和向后的步骤，与2n-2向前的步骤相抵。这意味着向前“成功”的数量是k+n-2，向后失败的数量是k-n。因此，

P（k，n，q）=组合（2*k-2，n+k-2）*q^（n+k-2）*（1-q）^（k-n）*q*2

最后一个q^2是最后两个步骤。我认为这与你的表达方式相当。

答复

我用格点格林函数解决了这个问题，正如休斯在《随机行走和随机环境》一书中所讨论的那样。以下生成函数展开为约为零的泰勒级数时，给出了系数$z^n$，即随机步行者在$n$步后首次到达200米终点线的概率：
\[
\左（\frac{1-\sqrt{1-4p（1-p）z^2}}{2（1-p）z}\right）^{200}\qquad\text{其中}p=0.52,0.54，\dots，0.90。
\]使用这种方法，我将关系合并到四阶，并精确地复制了盖·摩尔给出的概率。

答复

劳伦特 说：

2017年5月9日晚上9:39

整洁！谢谢！我冒昧地使用$\LaTeX$重新格式化了您的评论。如果有错别字，请告诉我。

答复

Pingback:缓慢的汽车追逐——书证

关于“幸运德比”的7点思考

留下回复取消回复