每个玩家的游戏状态由他们最近的3次掷硬币决定。因此有8种可能的状态:
\[
\textsf{HHH},\textsf{HHT},\textsf{HTH}
\]每个回合,每个玩家都会从一种状态转换到另一种状态,这取决于他们是翻转头部还是尾部。因此,它是一个马尔可夫链。以下是以图形表示的外观:
每个边的权重为$\frac{1}{2}$,因为我们正在掷一枚公平的硬币。数学上,我们可以写$P_{ij}$作为从状态$i$转换到状态$j$的概率,其中状态$1,2,\点,8$的顺序与上面的列表相同。(${\small\textsf{HHH}}:1$,${\small\textsf{HHT}}:2$,etc.)这会产生以下转换矩阵:
\[
P=\ frac{1}{2}\ begin{bmatrix}
1 & 1 & 0 & 0 & 0 & 0 & 0 & 0 \\
0 & 0 & 1 & 1 & 0 & 0 & 0 & 0 \\
0 & 0 & 0 & 0 & 1 & 1 & 0 & 0 \\
0&0&0&0&0&0&1&1\\
1 & 1 & 0 & 0 & 0 & 0 & 0 & 0 \\
0 & 0 & 1 & 1 & 0 & 0 & 0 & 0 \\
0 & 0 & 0 & 0 & 1 & 1 & 0 & 0 \\
0 & 0 & 0 & 0 & 0 & 0 & 1 & 1
\结束{bmatrix}
\]由于凯尔和朱利安都是独立投币,我们真正拥有的是马尔可夫链,其状态是笛卡尔积每个玩家的状态:$(x_\text{Kyle},x_\text{Julien})$。这个更大的马尔可夫链有$8乘以8=64$的状态,其转移矩阵是克罗内克产品两个较小的转换矩阵:$\hat P=P\otimes P$。矩阵$\hat P$具有以下稀疏模式
$\hat P$的所有非零条目都是$\frac{1}{4}$。这是一个有效的转换矩阵,因为每一行的总和为1,因为每行正好有四个非零条目。如果你好奇的话,这是图表的样子(哎呀!)
在增强马尔可夫链中,如果我们最终处于状态$(7,j)$,其中$j\neq 8$,则Kyle获胜。这对应于编号为的州:
\[
\数学的{X}(X)_\文本{K}=\{49,50,51,52,53,54,55\}
\]同样,如果我们最终进入状态$(i,8)$,其中$i\neq 7$对应于以下状态,则Julien获胜:
\[
\马查尔{X}(X)_\文本{J}=\{8,16,24,32,40,48,64\}
\]作为一个附加符号,让我们定义所有瞬态节点,这些节点不在$\mathcal中{X}(X)_\文本{K}$或$\mathcal格式{X}(X)_\文本{J}$。以下是50个节点:
\开始{multline}
\马查尔{X}_\文本{T}=
\{1,2,3,4,5,6,7,9,10,11,12,13,14,15,17,18,19,20, \\
21,22,23,25,26,27,28,29,30,31,33,34,35,36,37,38, \\
39,41,42,44,45,46,47,56,57,58,59,60,61,62,63\}
\结束{multline}注释两个玩家同时获胜的情况对应于$(7,8)$(状态号56),它仅被视为另一个瞬态节点,因为在这种情况下没有发生任何特殊情况。
既然我们已经建立了适当的数学框架,我们就可以解决原来的问题了。我们想知道凯尔赢得比赛的可能性。转换为Markov-speak,我们希望获得首次降落在$\mathcal的概率{X}(X)_\在$\mathcal中首次着陆前的文本{K}${X}(X)_\文本{J}$。假设$v_i$是Kyle获胜的概率,如果我们从节点$i$开始。我们可以进行以下观察:
- 每当$i\in\mathcal时,$v_i=1${X}(X)_\文本{K}$。如果我们处于凯尔获胜的状态,那么凯尔必须在朱利安之前获胜。
- 每当$i\in\mathcal时,$v_i=0${X}(X)_\文本{J}$。如果我们处于朱利安的获胜状态,那么凯尔不可能比朱利安先获胜。
- 如果$i\in\mathcal{X}(X)_\text{T}$,凯尔获胜的概率递归地取决于我们转换到下一个状态:
\[
v_i=\sum_{j=1}^{64}\hat P_{ij}v_j\qquad\text{if}i\in\mathcal{X}(X)_\文本{T}
\]
上面给出了要在$64$unknowns$v_1,\dots,v_{64}$中求解的$64$方程。简而言之,我们可以将解决方案写成:
\开始{align}
v_\text{K}&=1\\
v_\text{J}&=0\\
v_\text{T}&=\左(I-\hat P_{text{T},\text{T}}\右)^{-1}
\帽子P_{text{T},\text{K}}\mathbf{1}
\结束{align}自64个首发状态中的每一个都有相同的可能性,凯尔赢得比赛的概率就是向量$v$的平均值。以下是一个计算解决方案的简短Matlab脚本:
P=1/2*克朗([1;1],克朗(眼睛(4),[11]);s=[“HHH”,“HHT”,“HTH”,”HTT“,”THH“,”TTT“,“TTT”];Kwin=“TTH”;Jwin=“TTT”;XK=find(克朗(s==Kwin,s=Jwin));XJ=find(克朗(s~=Kwin,s==Jwin));XT=设置差异(1:64,联合(XK,XJ));Phat=氪(P,P);v=零(64,1);v(XK)=1;v(XJ)=0;v(XT)=(眼(长度(XT”))-相位(XT,XT))\Phat(XT、XK)*个数(长度(XK),1);平均值(v)
这个计算的结果是$\frac{45667}{71106}\大约64.22\%$。所以凯尔有64%的机会获胜!
额外信贷
在这里,我们考虑与之前相同的比赛,只是我们改变了凯尔和朱利安的获胜状态。为了做到这一点,我们循环遍历所有可能的获胜状态组合,并运行与上面相同的脚本。这产生了以下概率矩阵。行和列分别对应于凯尔和朱利安选择的获胜序列。矩阵中的条目是Kyle的获胜概率。
\[
\开始{bmatrix}
\压裂{1}{2}和\压裂{25439}{71106}和\压裂{1177}{2850}和\\压裂{2549}{71106}和\frac{25439}{71106{和\frac{1177}{2850}和\srac{25499}{71 106}\\
\压裂{45667}{71106}和\压裂{1}{2}&\压裂{28675}{52162}&\裂缝{1}}{2{&\压裂}1}{2]&\裂缝}28675{52162{&\裂缝\\
\压裂{1673}{2850}和\压裂{23487}{52162}和\压裂{1}{2}和\\压裂{2347}{52161}和\frac{23487}{5262}和\trac{1}}{2{和\frac{23488}{52163}\\
\压裂{45667}{71106}和\压裂{1}{2}&\压裂{28675}{52162}&\裂缝{1}}{2{&\压裂}1}{2]&\裂缝}28675{52162{&\裂缝\\
\压裂{45667}{71106}和\压裂{1}{2}&\压裂{28675}{52162}&\裂缝{1}}{2{&\压裂}1}{2]&\裂缝}28675{52162{&\裂缝\\
\压裂{1673}{2850}和\压裂{23487}{52162}和\压裂{1}{2}和\\压裂{2347}{52161}和\frac{23487}{5262}和\trac{1}}{2{和\frac{23488}{52163}\\
\压裂{45667}{71106}和\压裂{1}{2}&\压裂{28675}{52162}&\裂缝{1}}{2{&\压裂}1}{2]&\裂缝}28675{52162{&\裂缝\\
\压裂{1}{2}和\压裂{25439}{71106}和\压裂{1177}{2850}和\压裂{25439}{71106}和\压裂{25439}{71106}和\压裂{1177}{2850}和\压裂{25439}{71106}和\压裂{1}{2}
\结束{bmatrix}
\]或者,以数字形式,
\[
\小的
\开始{bmatrix}
0.5 & 0.357762 & 0.412982 & 0.357762 & 0.357762 & 0.412982 & 0.357762 & 0.5 \\
0.642238 & 0.5 & 0.54973 & 0.5 & 0.5 & 0.54973 & 0.5 & 0.642238 \\
0.587018 & 0.45027 & 0.5 & 0.45027 & 0.45027 & 0.5 & 0.45027 & 0.587018 \\
0.642238 & 0.5 & 0.54973 & 0.5 & 0.5 & 0.54973 & 0.5 & 0.642238 \\
0.642238和0.5&0.54973和0.5&0.5&0.54973和0.5&0.642238\\
0.587018 & 0.45027 & 0.5 & 0.45027 & 0.45027 & 0.5 & 0.45027 & 0.587018 \\
0.642238 & 0.5 & 0.54973 & 0.5 & 0.5 & 0.54973 & 0.5 & 0.642238 \\
0.5 & 0.357762 & 0.412982 & 0.357762 & 0.357762 & 0.412982 & 0.357762 & 0.5 \\
\结束{bmatrix}
\]注意,$(7,8)$单元格对应于我们在第一部分中解决的情况。许多单元格包含$\frac{1}{2}$;在这些情况下,凯尔和朱利安都有同样容易(或困难)获胜的州,他们正在努力实现这一目标。如果我们不知道朱利安会选择哪一个获胜序列,那么我们应该平均这个矩阵的行数,看看凯尔的平均的每一个可能的获胜序列的获胜机会。这将产生:
\[
\开始{数组}{ccc}
\text{凯尔}&\text{探测}&\text{数字}\\[-1mm]
\text{sequence}&\text{Kyle赢}&\text{approximation}\\hline
\文本{HHH}&\压裂{6875419}{16887675}&0.407126\\
\文本{HHT}&\frac{508129861}{927257793}&0.547992\\
\文本{HTH}&\frac{18467111}{37165425}&0.496890\\
\文本{HTT}&\frac{508129861}{927257793}&0.547992\\
\文本{THH}&\frac{508129861}{927257793}&0.547992\\
\文本{THT}&\frac{18467111}{37165425}&0.496890\\
\文本{TTH}&\frac{508129861}{927257793}&0.547992\\
\文本{TTT}&\压裂{6875419}{16887675}&0.407126\\
\结束{数组}
\]注意,上面的矩阵中重复了几行。这是因为,由于游戏中固有的对称性,不同的获胜状态选择可以被视为“等价”。具体来说,我们可以定义以下三个等价类:
\开始{align}
A&:\{\textsf{HHH},\textsf{TTT}\}\\
B&:\{\textsf{HTH},\textsf{THT}\}\\
C&:\{\textsf{HHT},\textsf{HTT},\textsf{THH},\ textsf{TTH}
\结束{对齐}我们可以将上表简化为:
\[
\开始{数组}{ccc}
\text{等价}&\text{探测}&\text{数值}\\[-1mm]
\text{class}&\text{Kyle获胜}&\text{approximation}\\hline
A&\压裂{6875419}{16887675}&0.407126\\
B&\压裂{18467111}{37165425}&0.496890\\
压裂{508129861}{927257793}&0.547992\\
\结束{数组}
\]根据这一分析,凯尔选择$B$等价类($\smalt\textsf{HTH}$或$\smald\textsf{THT}$)似乎导致游戏平均接近50%。这意味着,如果朱利安随机选择他的获胜顺序,游戏将平均接近完美公平。
其他解释
“接近1/2”的不同概念导致Kyle有不同的选择。例如,如果我们的公平概念是“尽可能经常等于1/2”,那么Kyle应该选择$C$选项。在这种情况下,如果朱利安随机选择,游戏将在50%的时间内完全公平。但在期权$B$中,游戏只有25%的时间是完全公平的。
或者,如果朱利安不是随机选择,而是贪婪地选择获胜顺序,以最大限度地提高获胜机会,该怎么办?如果凯尔知道朱利安正在这么做,并试图最大限度地增加他获胜的机会,那会怎么样?如果朱利安知道凯尔知道怎么办?(以此类推……)然后它就变成了单词的数学意义,解决方案是纳什均衡为了找到纳什均衡,根据等价类将凯尔获胜的概率改写为3美元乘以3美元的缩减矩阵:
\[
\开始{bmatrix}
\压裂{1}{2}&\压裂{1177}{2850}&\裂缝{25439}{71106}\\
\压裂{1673}{2850}&\压裂{1}{2}&\裂缝{23487}{52162}\\
\压裂{45667}{71106}&\压裂{28675}{52162}&\裂缝{1}{2}
\结束{bmatrix}
\近似值
\开始{bmatrix}
0.5 & 0.412982 & 0.357762 \\
0.587018 & 0.5 & 0.45027 \\
0.642238 & 0.54973 & 0.5
\结束{bmatrix}
\]
在这个游戏中,凯尔选择一行,朱利安选择一列。Kyle想要最大化结果数,而Julien想要最小化结果数。通过检查,我们可以看到Kyle和Julien的最佳选择再次是选择$C$选项。
所以也许对凯尔来说,$C$毕竟是一个更明智的选择!