这个Riddler帖子因为今天是一场酒吧游戏,你掷硬币,根据结果向前或向后移动。问题是:
考虑一个热门的新酒吧游戏。它是用一枚硬币在你和朋友之间玩的,在一条从负无穷到正无穷的数字线上。(这是一个非常非常长的条。)你被分配了一个中奖号码,负整数-X,而你的朋友被分配了自己的中奖号码(正整数+Y)。一个标记被放置在数字行的零处。然后硬币被反复翻转。每次硬币正面落地时,标记都会向正方向移动一个整数。每次硬币落在尾部时,标记都会向负方向移动一个整数。如果硬币先到达-X,你就赢了;如果硬币先达到+Y,你的朋友就赢了。(胜利者保留硬币。)
你能在酒吧里扔硬币坐多久?换句话说,在一场完整的比赛中,预期的掷硬币次数是多少?
这是我的解决方案:
[显示解决方案]
这个问题众所周知赌徒的毁灭这是一个一维的例子随机游走在典型的赌徒破产设置中,你反复掷硬币,根据结果,要么获得1美元,要么失去1美元。你有一个固定的起始预算和一个想要的目标金额。你继续玩,直到你达到了你的目标金额,或者你用完了钱。我们在这里看到的酒吧游戏正是赌徒的毁灭,但却发生了变化,你从0美元开始,到你涨到Y美元或负债X美元结束。
这里有一个可能的解决方案。让我们将$E_n$定义为一个完整游戏中预期的掷硬币次数,假设标记开始于数字行上的$n$位置。我们想找到$E_0$。假设在每次翻转时,我们以概率$p$向前移动,以概率$q$向后移动(其中$p+q=1$)。如果我们目前处于$n$,那么概率为$p$,我们来自$n-1$,概率为$q$,我们从$n+1$。不管怎样,我们又发生了一次翻转。因此,我们可以写出预期硬币翻转次数的以下递推关系:
\开始{align}
E_{-X}&=0\\
E_n&=pE_{n-1}+qE_{n+1}+1\qquad\text{代表}-X<n<Y\\E_Y&=0\结束{对齐}在矩阵形式下,这些方程如下所示:\[\开始{bmatrix}1&-q&0&\点&0\\-p&1&-q&\ddots&\vdots\\0&-p&1&\ddots&0\\\vdots&\ddots&\ ddots&\ ddots&\ddot&-q\\0&\点&0&-p&1\结束{bmatrix}\开始{bmatrix}E_{-X+1}\\E_{-X+2}\\vdots\\E_{Y-2}\\E_{Y-1}\结束{bmatrix}=\开始{bmatrix}1\\\\vdots\\1\\1\结束{bmatrix}\]这个方程组的结构很好;左边的矩阵都是对角和特普利茨.人们可以解出这个方程组使用特殊形式的高斯消去例如。
虽然这些方程有一个封闭的解,但它相当混乱。相反,我将展示如何在$p=q=\tfrac{1}{2}$的情况下手动得出答案。最后一个方程可以用$E_{Y-2}$求解$E_{Y-1}$:
\[
E_{Y-1}=\tfrac{1}{2}E_{Y-2}+1
\]
然后,我们可以将其代入第二个方程,并根据$E_{Y-3}$求解$E_{Y-2}$:
\[
E_{Y-2}=\tfrac{2}{3}E_{Y-3}+2
\]
代入第三个方程,用$E_{Y-4}$求解$E_{Y3}$:
\[
E_{Y-3}=\tfrac{3}{4}E_{Y-4}+3
\]
模式现在很清楚了(如果你愿意,可以用归纳法证明它)。继续这种方式,直到我们到达起点,
\[
E_{1}=(1-\tfrac{1}{Y})E_{0}+Y–1
\]
我们可以做类似的事情,但要从另一端开始。例如,用$e_{-X+2}$求解$e_{-X+1}$,然后用$e_{-X+3}$求解$e_{-X+2}$,依此类推。这一次,我们得到了结果:
\[
E_{-1}=(1-\tfrac{1}{X})E_0+X–1
\]
现在,我们可以将我们的劳动成果与唯一尚未使用的方程结合起来,该方程涉及$E_0$、$E_1$和$E_{-1}$。结果是:
\开始{align}
E_0&=\tfrac{1}{2}E_{-1}+\tfrac}1}{2]E_1+1\\
&=\tfrac{1}{2}\左\\
&=\tfrac{1}{2}\左
\结束{对齐}
重新排列并求解$E_0$,我们得到:
$\显示样式
E_0=\压裂{Y+X}{\tfrac{1}{X}+\tfrac}{1}}{Y}}=XY
$
可以使用类似的方法计算每个玩家获胜的概率。为了做到这一点,让$P^Y_n$作为我们首先到达$Y$的概率,假设我们当前处于$n$,并且类似地定义$P^X_n$。然后递归看起来像:
\开始{align}
P^Y_{-X}&=0\\
P^Y_n&=P P^Y_{n-1}+q P^Y_{n+1}\qquad\text{代表}-X<n<Y\\P^Y_Y&=1\结束{对齐}写成矩阵,这个问题和寻找期望的问题之间唯一的区别是方程的右边!使用类似的递归方法,我们可以求解方程,并获得:
$\显示样式
P_0^X=\压裂{Y}{X+Y}\qquad\text{和}\qquid P_0^Y=\压裂}{X+Y}
$
因此,实际上,如果我们必须在数字线上走两倍于对手的距离,那么我们赢得比赛的可能性是对手的一半。为了好玩,我画了一些图,展示了如果你不使用公平的硬币,预期价值和获胜概率是如何变化的。图中显示了$X+Y=50$的情况。例如,40%的曲线意味着硬币在40%的时间里朝你的方向翻转。
如果您对案例$p\ne\tfrac{1}{2}$的解决方案的推导感兴趣,这里有一组写得很好的注释在这里.
下面是一个更巧妙的解决方案,承蒙丹尼尔·罗斯:
[显示解决方案]
将随机变量$\{Z_i\}$和$S_k$定义为:
\[
Z_i=\begin{cases}1&\text{the}i^\text{th}\text{flipis}H\\
-1&\text{the}i^\text{th}\text{flipis}T
\结束{cases}
\qquad\text{和}\qquad S_k=\sum_{i=1}^k Z_i
\]
另外,让$T$是与游戏持续时间相对应的随机变量。因此,$S_T$是一个随机变量,它的唯一可能值是概率为$r$的$-X$,或概率为$(1-r)$的$Y$。
沃尔德方程和沃尔德第二方程(有时也称为Blackwell-Girshick方程)给出了同分布随机变量的随机长度和的平均值和方差的表达式:
\开始{align}
\矩阵{E}(T)\\
\mathbb{E}(T)\mathrm{Var}(Z_1
\结束{对齐}
由于$\mathbb{E}(Z_1)=0$,第一个方程简化为$0=-rX+(1-r)Y$。求解$r$,我们得到
\[
r=\mathbb{P}(\text{游戏结束于}–X)=\frac{Y}{X+Y}
\]
由于$\mathrm{Var}(Z_1)=1$,第二个方程是$\mathbb{E}(T)=rX^2+(1-r)Y^2$。将我们发现的值替换为$r$,我们得到
\[
\矩阵{E}(T)=\分形{Y}{X+Y}X^2+\分形{X}{X+Y}Y^2=XY
\]
就这样!