这个谜题关于一个有趣的游戏,包括从盒子里挑选彩球。比赛会持续多久?
你用四个球玩游戏:一个球是红色的,一个是蓝色的,另一个是绿色的,还有一个是黄色的。它们被放在一个盒子里。你从盒子里随机抽出一个球,注意它的颜色。在不替换第一个球的情况下,绘制第二个球,然后将其绘制为与第一个球相匹配的颜色。更换两个球,然后重复此过程。当所有四个球都变成相同的颜色时,比赛结束。完成游戏的预期圈数是多少?
额外学分:如果有更多的球和更多的颜色怎么办?
这是我对第一部分(四个球)的解决方案:
[显示解决方案]
在我开始之前,我想确认一下赫克托·佩福和Sawyer Tabony公司他还发布了这个Riddler难题的优秀解决方案。我们都得出了相同的答案(嗖!),但我们的方法略有不同。
思考这个问题的一种自然方式是,游戏可以存在一些状态(盒子中球的特定颜色)。在每一步中,最多有一个球被重新着色,然后我们转换到另一个状态。这种状态和跃迁概率的集合称为马尔可夫链.由于我们只关心所有球的颜色保持一致需要多长时间,所以没有必要跟踪每个可能的状态;我们可以聚合状态并简化问题。
分区方法
聚集状态的一种方法是计算每个不同颜色的球的数量,而不考虑颜色本身。例如,4个球可以用5种不同的方式分割:
\[
1+1+1+1
2+1+1,\qquad
2+2,\qquad
3+1,厄瓜多尔
4
\]例如,分区“2+1+1”由两个相同颜色的球和另外两个其他颜色的球组成。“红+红+绿+蓝”和“蓝+蓝+黄+红”都属于“2+1+1”类。通过使用这五个分区作为马尔可夫链中的状态,我们可以计算从一个状态到下一个状态的转移概率。例如,从“2+1+1”转换到“3+1”的概率是$\frac{1}{3}$,因为为了发生这种转换,我们必须首先从两个颜色相同的球中选择一个(概率$\frac{2}{4}$),然后我们必须从其余三个球中选择另两个球中的一个(几率$\frac:{2}}{3{$)。
以下是填写所有转移概率后的完整马尔可夫链:
如果我们按顺序标记状态,我们可以将转移概率写为描述状态如何演变的矩阵。
\[
A=\开始{bmatrix}
0 & 0 & 0 & 0 & 0 \\
1&\压裂{1}{2}&0&0\\
0&\frac{1}{6}&\frac{1}{3}&\frac{1{4}&0\\
0&\压裂{1}{3}&\压裂{2}{3{&\压裂}1}{2}&0\\
0&0&0\\frac{1}{4}&0
\结束{bmatrix}
\]例如,如果$x$是我们当前的分发,那么$Ax$是一次移动后的分发。请注意,这些列的总和为$1$,因为在每个状态下,我们都必须转换到其他状态。唯一的例外是最后一列,因为一旦我们到达最终状态,游戏就会停止。
要计算游戏在$k$回合后结束的概率,我们应该找到游戏在$k$回合后处于最终状态的概率。因为我们从状态$1$开始,所以所需的数量是$\left[A^k\right]_{51}$。换句话说,$A^k$的$(5,1)$组件。我们可以直接计算每个$k$的值,并获得以下分布:
请注意,1或2圈的概率为零,因为游戏不能这么快结束。将所有球涂成相同的颜色至少需要三圈(因为总共有四个球)。我们还可以通过求和来计算预期的圈数:
\[
A+2A^2+3A^3+\点
=A(I-A)^{-2}
\]然后提取$(5,1)$分量。在这种情况下,结果是9。当我们将分布与上图中的平均值进行比较时,我们注意到分布有一个重尾;虽然平均值是9,但最可能的圈数实际上是5。
以下是我对$N$球的一般情况的解决方案:
[显示解决方案]
虽然可以将上一部分中使用的分区扩展到任何其他数量的球,但实际上这是一个挑战。第一个障碍之一是分区数量作为$N$的函数是一个难以处理的数量。它被称为配分函数并被数学家研究,因为它与素数有着深刻的联系。最近的电影中甚至提到了分区函数拉马努詹,“知道无限的人”。所以我们不会采取这种方法。
计数蓝色
我们仍然可以使用马尔可夫链,但我们必须想出一种不同的方式来聚集状态。一种可能性是定义状态$k=1,2,\点,N$,这些状态对应于方框中的蓝球数量。如果Blue最终获胜,我们将从状态1开始,最终到达状态N,而永远不会到达状态0。诀窍是要认识到,无论哪种颜色获胜,获胜的颜色都有这样的马尔可夫链。所有颜色都无法区分,所以我们不妨考虑蓝色获胜的情况。
下一步是计算转移概率。在这里,我们必须小心,因为我们的条件是蓝队获胜。所以我们使用贝叶斯法则计算转换。假设有$k$蓝球和$1\le k\le N-1$,我们将$k\转换为k+1$的概率为:
\[
A_{k+1,k}=\frac{\mathbb{P}(k\tok+1\text{,蓝赢})}{\mathbb{P{(\text{Blue wins}){
=\压裂{\压裂{k}{N}\cdot\frac{N-k}{N-1}\cdot \压裂{k+1}{N}}{\压裂}{k}{N}}=\压裂}(k+1)(N-k)}{N(N-1)}
\]类似地,我们将$k转换为k-1$的概率是:
\[
A_{k-1,k}=\frac{\mathbb{P}(k\to-k-1\text{,蓝赢})}{\mathbb{P{(\text{Blue wins}){
=\frac{\压裂{N-k}{N}\cdot\压裂{k}{N-1}\cdot \压裂{k-1}{N{}{压裂{k{{N}}=\压裂{(k-1)(N-k)}{N(N-1)}
\]唯一的另一种可能性是,我们根本不过渡,这就是剩下的时间里会发生的事情。所以$A{k,k}=1-A{k+1,k}-A{k-1,k}$。简化表达式,我们得到:
\[
A_{k+1,k}=\压裂{(k+1)(N-k)}{N(N-1)},\四元
A_{k-1,k}=\压裂{(k-1)(N-k)}{N(N-1)},\四元
A_{k,k}=1-\压裂{2k(N-k)}{N(N-1)}
\]如前所述,$k^\text{th}$列的总和为1。和以前一样,唯一的例外是最后一列$A_{:,N}$,它为零,因为一旦所有颜色都相同,游戏就结束了。这里的方法与我们使用分区时的方法相同。我们可以通过计算$\left[A^k\right]{N,1}$来计算$k$圈结束的概率,预期的圈数由$\left[A(I-A)^{-2}\right]{N,1}$给出。以下是$N=5$和$N=8$的分布。
正如我们所看到的,当我们增加$N$时,分布看起来很相似。奇怪的是,平均值似乎总是$(N-1)^2$。在下一节中,我们将说明这确实是一般情况!
分析表达式
明确写出转换矩阵,我们得到:
\[
A=\开始{bmatrix}
1-\压裂{2(N-1)}{N(N-1\\
\裂缝{2(N-1)}{N(N-1\\
&\压裂{3(N-2)}{N(N-1)}&1-\压裂{6(N-3)}{N(N-l)}&\ddots&&0\\
&&&frac{4(N-3)}{N(N-1)}&&ddots&&frac{(N-2)1}{N(N-1)}&0\\
&&&\ddots&1-\frac{2(N-1)1}{N(N-1)}&0\\
&&&&\压裂{N\cdot 1}{N(N-1)}&0
\结束{bmatrix}
\]如果我们将$a_k$定义为游戏结束前的预期圈数,假设我们当前处于$k$状态,我们可以编写递归:
\开始{align}
a_k&=1+a_{k+1,k}a_{k+1}+a_}k,k}a_k+a{k-1,k}a a_{k-1}\ quad\text{表示}k=1,\点,N-1\\
a_N&=0
\结束{align}重新排列这个表达式看起来大致像$A^Ta+1=A$(除了最后一行)。把它写成一个单一的紧致方程,我们可以把一些因素考虑进去,得到一个更简单的方程:
\开始{multline}
\裂缝{1}{N(N-1)}
\开始{矩阵}N-1&&&\\&\ddots&&\\&&2&\\&&&1\end{bmatrix}
\开始{bmatrix}2&-1&&\\-1&2&\ddots&\\&\ddot&\ddotes&-1\\&&-1&2\end{bmatrix}\\
\时间\开始{bmatrix}1&&\\&2&&\\&&\ddots&\\&&N-1\end{bmatrix}
\开始{bmatrix}a1\\a_2\\vdots\\a_{N-1}\end{bmatrix}
=
\开始{bmatrix}1\\1\\\vdots\\1\end{bmatrix}
\结束{multline}或,简化:
\[
\开始{bmatrix}2&-1&&\\-1&2&\ddots&\\&\ddot&\ddotes&-1\\&&-1&2\end{bmatrix}
\开始{bmatrix}a1\\2a_2\\vdots\\(N-1)a_{N-1}\end{bmatrix}
=
N(N-1)\开始{bmatrix}\压裂{1}{N-1}\\frac{1}}{N-2}\\vdots\\1\end{bmatricx}
\]通过执行LU分解,我们可以依次求解以下方程组:
\开始{align}
\开始{bmatrix}1&&&&\\frac{1}{2}&&\\&-\frac{2}{3}&1&\\&\\ddots&\ddots&\\&&-\frac{N-2}{N-1}&1\end{bmatricx}
\开始{bmatrix}y_1\\y_2\\vdots\\y_{N-2}\\y_{N-1}\结束{bmatricx}
&=N(N-1)\begin{bmatrix}\frac{1}{N-1}\\frac{1'{N-2}\\vdots\\\frac}1}{2}\\1\end{bmatricx}\\
\开始{bmatrix}2&&-1&&\\\\frac{3}{2}&&-1&&\\\\frac{4}{3}&&\ddots&&\\\ddots&&-1\\\\\\\frac{N}{N-1}\结束{bmatrix}
\开始{bmatrix}a_1\\2a_2\\vdots\\(N-2)a{N-2}\\(N-1)a{N-1}\结束{bmatricx}
&=\开始{矩阵}y1\\y_2\\vdots\\y_{N-2}\\y_{N-1}\end{bmatrix}
\结束{align}第一个系统很容易通过前向替换以$y$的价格解决。我们首先有$y_1=N$。然后,$y_2=\压裂{N(N-1)}{N-2}+\压裂{1}{2} y_1$,依此类推。我们发现的结果是:
\[
y_k=N(N-1)\sum_{i=1}^k\frac{i}{(N-i)k}
\]第二个系统可以通过反向认购以$a$的价格进行求解,从最后的等式开始,然后通过我们的方式进行反向求解。这样做,我们发现:
\[
a_k=\sum_{j=1}^{N-k}\压裂{1}{k+j}y_{k+j}
\]现在,我们可以组合这两个表达式,并获得:
\[
a_k=N(N-1)\sum_{j=1}^{N-k}\frac{1}{k+j}\sum_{i=1}^[k+j-1}\frac{i}{(N-i)(k+j-1)}
\]这有点混乱,但我们只关心$k=1$(考虑到我们只从一个蓝球开始,蓝球最终获胜的预期回合数)。只要稍作努力,这个总数就可以简化:
\开始{align}
a_1&=N(N-1)\总和{j=1}^{N-1}\压裂{1}{j(j+1)}\总和{i=1}^}{j}\压裂}{(N-i)}\\
&=N(N-1)\sum_{j=1}^{N-1}\左(\frac{1}{j}-\压裂{1}{j+1}\右)\sum_{i=1}^{j}\压裂{i}{(N-i)}
\结束{align}定义$Q_j:=\frac{1}{j+1}\sum_{i=1}^j\frac{i}{N-i}$和望远镜:
\开始{align}
a_1&=N(N-1)\sum_{j=1}^{N-1}\左(压裂{1}{N-j}+Q_{j-1}-Q_j\右侧)\\
&=N(N-1)\左(\sum_{j=1}^{N-1}\压裂{1}{N-j}-Q_{N-1}\右)\\
&=N(N-1)\左(\sum_{j=1}^{N-1}\压裂{1}{N-j}-\frac{1}{N}\sum_{j=1}^{N-1}\frac{j}{N-j}\right)\\
&=N(N-1)\sum_{j=1}^{N-1}\压裂{1}{N}\\
&=(N-1)^2
\结束{align}和这正是我们想要展示的!使用$N$个球的游戏的预期回合数为$(N-1)^2$。可以进行类似的展开来计算$k\ne1$的$A_k$,但在这种情况下,只有部分伸缩,剩下的是
\[
a_k=(N-1)^2-\frac{N(N-1)}{k}\sum_{i=1}^k\frac{k-i}{N-i}
\]随着$N$变大,倒数之和很好地近似于对数。如果我们表示$\alpha=k/N$为蓝色球的分数,那么直到所有球都为蓝色之前的预期圈数为:
\[
\frac{a_k}{(N-1)^2}\近似\左(\frac{1-\alpha}{\alpha{right)\log\左(\frac{1}{1-\alpha}\右)
\]以下是预期匝数分布的比例图:
猜测?
我对分布而不仅仅是预期值。如上图所示,分布收敛到某个值,但不清楚是什么。而且似乎没有一种简单的方法来计算或近似$A$的解析幂。我怀疑分布趋向于对数正态分布随着$N$变大,因为在对数刻度上绘制时,它看起来确实很正常:
如果你有任何想法,请在下面留言!