本着肯塔基州德比的精神谜题是关于一种特殊类型的赛马。
号角响起,20匹马向第一届年度幸运赛马会的出发门驶去。这些马都是在神秘的谜语人马厩训练的,很特别。每一秒,每一匹经过Riddler训练的马都要迈一步。每一步正好一米长。但这些马表现出的精确性,它们缺乏方向感。大多数时候,他们的步伐是向前的(朝向终点线),但其余时间他们是向后的(远离终点线)。作为Lucky Derby的狂热粉丝,您对这20位参赛者进行了详尽的研究。你知道,一号马前进52%,二号马54%,三号马56%,以此类推,直到最喜欢的小雌马,二十号马,90%的时间都在前进。马步是相互独立的,终点线距离起点200米。
阻止这场比赛并下注!换言之,每匹马获胜的几率是多少(百分之一是好的)?
这是我的完整推导(长!):
[显示解决方案]
让我们看看一匹特殊的马。每一步,假设它以概率$q>\frac{1}{2}$向前移动,或以概率$1-q$向后移动。马从位置$0$开始,我们想知道它以$2k$的步幅到达位置$2n$的概率。$2$因子的原因是,要达到偶数位置(如问题陈述中的$200$),马必须采取偶数步数。我们把这个概率称为$P(n,k,q)$。
这种情况称为一维随机游走,过去处理类似想法的帖子包括致命的棋盘游戏和赌徒的废墟然而,这个问题有点不同,因为我们关心所需移动次数的分布(不仅仅是预期的移动次数)。
回到手头的任务:确定$P(n,k,q)$。如果我们在$2k$的移动中达到$2n$的位置,那么很明显我们有$k\gen$。接下来,我们可以推断,我们必须向前移动$(k+n)$次,向后移动$(k-n)$倍。发生这种情况的概率是$q^{n+k}(1-q)^{n-k}$。这里最棘手的部分是处理秩序我们采取步骤。我们采取的最后一步必须始终向前,因此我们将限制注意力安排剩余的2k-1$步。总共有2k-1美元\choose k-n$种方法可以做到这一点,但这不是我们要找的数字!其中一些路径将提前到达$2n$,因此我们将计算这些路径并减去它们。
我们正在计算的数量与加泰罗尼亚数字,我们可以借用类似的证明技术(即安德雷反射法)从而得出解决方案。这里有一个论点:想象这条路是一条“山脉”,每一个2k-1$的台阶都是向右移动,或者向上或向下移动,这取决于台阶是向前还是向后移动。下图显示了$n=2$和$k=5$的有效路径。请注意,我们可以消极对待!
我们希望排除在早些时候达到$n$的“坏路径”。考虑出现这种情况的第一个点,并反映关于行$y=2n$的路径的其余部分。这将导致一条新路径,该路径具有$(k+n)$向前步骤、$(k-n-1)$向后步骤,并以$2n+1$而不是$2n-1$结束。有关反射方法的说明,请参见下图。
坏路径和长度为$2k-1$且达到$2n+1$的无约束路径之间存在一对一的对应关系。因此,有效路径的总数(总路径减去坏路径)由下式给出:
\[
{2k-1 \选择k-n}-{2k-1\选择k-n-1}=\压裂{n}{k}{2k\选择k-n}
\]简化如下:(这些身份),但也可以使用代数轻松推导。综上所述,一匹马以2k$的步幅首次达到2n$的概率由以下公式给出:
$\显示样式
P(n,k,q)=\frac{n}{k}{2k\选择k-n}q^{k+n}(1-q)^{k-n},\quad\text{表示}k=n,n+1,\dots
$
我们可以为我们的利息情况绘制分布图,即$n=100$,$q$从$0.52$(对于马$1$)到$0.90$(对于马$20$)不等。以下是一些马的分布图:
正如我们所看到的,这些分布是正态分布到非常好的近似值。尽管它们具有操作表达式的挑战性,但这项任务并不超出Mathematica的能力!事实上,我们可以验证$P$是一个合法的概率质量函数,并且我们还可以计算它在$\tfrac{1}{2}情况下的均值和方差:
\开始{align}
\sum_{k=n}^\infty P(n,k,q)&=1&\text{(和为1)}\\
\sum_{k=n}^\infty k\,P(n,k,q)&=\tfrac{n}{2q-1}&&\text{(计算平均值)}\\
\sum_{k=n}^\infty\bigl(k-\tfrac{n}{2q-1}\bigr)^2P(n,k,q)&=\tfrac[2nq(1-q)}{(2q-1)^3}&\text{(计算方差)}
\结束{align}此处是一些马的平均值和标准偏差:
\开始{align}
\文本{Horse 4}&大约1250 \ pm 218\\
\文本{马8}&\约625\pm 74\\
\文本{马12}&\约417\pm 37\\
\文本{马16}&\约313\pm 21\\
\文本{马20}&\约250\pm 12
\结束{对齐}注:我们必须将上述公式的平均值和标准偏差加倍,因为这些公式跳过奇数长度(这是不可能的)。在进行连续近似时,我们希望填充这些空格!
我们马上注意到的一件事是,分布是非常分离的(这是对数刻度!)。唯一有可能击败20匹马的马是紧随其后的马。让我们再按线性比例绘制一次分布图,但仅限于顶级马匹:
如果马$i$以$h_i$步完成,则计算马$i$获胜的概率相当于找到所有$i\nej$的$h_i>h_j$的概率。我们可以将其近似为:
\开始{align}
\mathbb{P}(h_i>h_j\,\对于所有i\ne j)
&\近似值\int_{-\infty}^\infty \mathbb{P}(h_i=x)\prod_{j\nei}\mathbb{P}(h_j>x)\,\mathrm{d}x\\
&=\int_{-\infty}^\infty \frac{1}{\sigma_i}\varphi_i(z_i)\prod_{j\ne i}\left(1-\Phi(z_j)\right)\,\mathrm{d}x\\
\结束{align}其中$\varphi$和$\Phi$是标准的概率密度(pdf)和累积分布(cdf)正态分布$zk=\tfrac{x-\muk}{\sigmak}$是为$k^\text{th}$horse计算的标准正常偏差($\muk$和$\sigma k$是前面计算的平均值和标准偏差)。
这是一个非常复杂的积分,它不存在封闭解,所以我们必须用数值计算它。关于解决方案,请继续阅读!
对于tl;博士,答案是:
[显示解决方案]
下表显示了每匹马获胜的概率。
马的编号 |
赢得比赛的可能性 |
20 |
71.27% |
19 |
21.54% |
18 |
5.605% |
17 |
1.268% |
16 |
0.2595% |
15 |
0.05085% |
14 |
0.01018% |
13 |
0.002212% |
正如我们所看到的,这对1到17匹马来说并不好。排名前几的马是唯一有合法获胜机会的马!
注:由于这些概率是使用连续近似计算的,所以我根本没有考虑平局。如果你必须是一个明确的胜利者才能被宣布为胜利者,那么概率都会降低。第一匹马的效果最大(获胜概率下降约5%),但其他马的效果要小得多(第18匹马的概率仅下降约0.5%)。