本周的Riddler经典是一种四边骰子游戏:
你有四个公平的四面体骰子,其四边编号为1到4。
你玩的是一个游戏,你将它们全部滚动,并将它们分为两组:值唯一的组和值重复的组。例如,如果你掷1、2、2和4,那么1和4将进入“唯一”组,而2将进入“重复”组。
接下来,重新掷重复池中的所有骰子,并再次对所有骰子进行排序。继续前面的例子,这意味着你要重播2。如果结果恰好是1和3,那么“唯一”组现在将由3和4组成,而“重复”组将有两个1。
您继续重新滚动重复的池并对所有骰子进行排序,直到所有骰子都是同一组的成员。如果所有四个骰子都在“唯一”组中,则您获胜。如果这四个人都在“重复”组中,你就输了。
你赢得比赛的概率是多少?
我的解决方案:
[显示解决方案]
我们可以将此游戏视为马尔可夫链。在任何时候,我们都会状态当我们重新掷骰子时,我们会转换到不同的状态。尽管有许多可能的状态(每种可能的掷四个骰子的方式都有一个),但我们可以使用对称参数将总状态减少到只有四个。它们在这里:
- 所有骰子都是重复的。这包括(1,1,1,1)和(2,2,3,3)等情况。如果我们达到这个位置,比赛就结束了,我们就输了。
- 三个骰子是重复的。例如:(1,1,1,2)
- 两个骰子是重复的。例如:(1,1,2,3)
- 没有骰子是重复的。例如:(1、2、3、4)。如果我们达到这个位置,比赛就结束了,我们就赢了。
我们可以将每个状态转换与一个概率相关联。例如,假设我们滚动(1,1,2,3)。我们处于“双重”状态。我们必须重新执行两个1,可能会发生四件事:
- 我们滚动(2,2)或(3,3)(概率为1/8)。我们现在有3个副本,游戏还在继续。
- 我们滚动(2,3)或(3,2)(概率为1/8)。我们现在有4个副本,比赛结束(我们输了)。
- 我们滚动(1,4)或(4,1)(概率为1/8)。我们现在没有复制品,比赛结束了(我们赢了)。
- 我们掷任何其他东西(概率为5/8)。我们又重复了两次,比赛继续进行。
如果我们以这种方式继续下去,并找到所有四个状态之间的所有可能转移概率,我们将得到以下图表:
我们可以将“三重”状态视为开始状态。为什么?因为我们以掷四个骰子开始游戏。这在数学上等同于掷三个骰子,因为我们不掷的骰子的值可能是我们第一次掷骰子(所有数字都是对称的)。因此,我们可以将我们的转换表示如下:
\[
A=\开始{bmatrix}
1&\压裂{5}{32}&\压裂}1}{8}&0\\
0&\压裂{3}{16}&\压裂{1}{8}&0\\
0&\frac{9}{16}&\frac{5}{8}&0\\
0&\压裂{3}{32}&\压裂{1}{8}&1
\结束{bmatrix},\qquad
x_0=\开始{bmatrix}
0\\1\\0\\0\结束{bmatrix}。
\]请注意,所有列的总和为1,因为每个节点沿传出边的概率总和必须为1。我们可以将当前状态分布看作一个列向量,其和为1。例如,我们的初始状态由上面的$x_0$给出,因为我们从概率为1的“三重”状态开始。每次我们转换到新状态时,可以通过将当前状态乘以$a$来找到新的分布。换句话说:
\[
x_{k+1}=A x_k,\quad\text{代表}k=0,1,\dots
\]问题是:我们平均会在哪里结束?这相当于要求限制
\[
x_\infty=\lim_{k\to\infty}A^k x_0
\]我们可以通过执行特征值分解来找到这个极限:
\开始{align}
A&=V\Lambda V^{-1}\\
&=\开始{bmatrix}
0&1&\压裂{23}{21}&-1\\
0&0&-\压裂{8}{21}&30\\
0&0&-\压裂{12}{7}&-30\\
1 & 0 & 1 & 1
\结束{bmatrix}
\开始{bmatrix}
1 & 0 & 0 & 0 \\
0&1&0&0\\
0&0&\压裂{3}{4}&0\\
0&0&0&\压裂{1}{16}
\结束{bmatrix}
\开始{bmatrix}
0&\frac{9}{20}&\frac{29}{60}&1\\
1&\压裂{11}{20}&\压裂}31}{60}&0\\
0&-\压裂{21}{44}&-\裂缝{21}{44}&0\\
0&\压裂{3}{110}&-\压裂{1}{165}&0
\结束{bmatrix}
\结束{align}因此,限制为:
\开始{align}
A ^\infty x_0&=V\Lambda ^{\infty}V^{-1}x0 \\
&=\开始{bmatrix}
0&1&\压裂{23}{21}&-1\\
0&0&-\frac{8}{21}和30\\
0&0&-\压裂{12}{7}&-30\\
1 & 0 & 1 & 1
\结束{bmatrix}
\开始{bmatrix}
1&0&0&0\\
0 & 1 & 0 & 0 \\
0 & 0 & 0 & 0 \\
0 & 0 & 0 & 0
\结束{bmatrix}
\开始{bmatrix}
0&\frac{9}{20}&\frac{29}{60}&1\\
1&\压裂{11}{20}&\压裂}31}{60}&0\\
0&-\压裂{21}{44}&-\裂缝{21}{44}&0\\
0&\压裂{3}{110}&-\压裂{1}{165}&0
\结束{bmatrix}\开始{bmatricx}
0\\1\\0\\0\结束{bmatrix}\\
&=\开始{bmatrix}
0 & 1 \\
0 & 0 \\
0 & 0 \\
1 & 0
\结束{bmatrix}
\开始{bmatrix}
0&\frac{9}{20}&\frac{29}{60}&1\\
1&\压裂{11}{20}&\压裂}31}{60}&0
\结束{bmatrix}
\开始{bmatrix}
0\\1\\0\\0\结束{bmatrix}\\
&=\开始{bmatrix}
\压裂{11}{20}\\0\\压裂{9}{20{end{bmatrix}
\结束{align}输入换言之,我们有11/20或55%的机会输掉比赛,并以“全重复”的方式结束比赛,还有9/20或45%的机会获胜,最终以“全独特”的方式终结比赛。