疯狂的鸭子-书证

本周的Riddler经典关于晶格上的随机漫步：

两只神志不清的鸭子在池塘里很难找到彼此。池塘恰好包含一个3×3的岩石网格。

每分钟，每只鸭子都会独立于另一只鸭子随机地从一块岩石游到邻近的岩石，以3×3的网格排列——向上、向下、向左或向右，但不是对角。因此，如果一只鸭子在中间的岩石上，它接下来将以1/4的概率游向四块岩石中的一块。它从一块侧岩游向两块相邻的角岩中的一块，或游回中间的岩石，每一块概率为1/3。从一块角石上，它将以1/2的概率游向两块相邻的边石中的一块。

如果鸭子都从中间的岩石开始，那么平均需要多长时间才能再次到达同一岩石？（当然，在第一分钟后，他们有1/4的机会朝同一方向游，在这种情况下，他们只需要一分钟就可以再次到达同一块岩石。但如果他们碰巧一直彼此错过，可能需要更长的时间。）

额外学分：如果有三只或更多的鸭子怎么办？如果他们都从中间的岩石开始，平均需要多长时间才能再次回到同一岩石上？

这是我的解决方案：
[显示解决方案]

一只鸭子

我们将从一个更简单的问题开始，逐步解决这个问题。让我们考虑一下岩石网格上的一只鸭子。在每一步中，鸭子都会随机移动到附近的一块石头上。我们可以使用马尔可夫链每种状态都是不同的岩石，有向边缘标有转移概率。下面是马尔可夫链的图：

如果我们以与上述相同的方式对状态进行编号，则该马尔可夫链的转移矩阵为：
\[
P=\开始{bmatrix}
0&&\trac12&0&&\trac12&0&0&0&0&0\\
\tfrac13&0&\tfrac13&0&\tfrac13&0&0&0\\
0&\tfrac12&0&0&\ttrac12&0&0&0\\
\tfrac13&0&0&0&\tfrac13&0&\tfrac13&0&0\\
0&\tfrac14&0&\ttrac14&0&\tfrace14&0\\
0&0&\tfrac13&0&\t frac13&0&0&\tfrac13\\
0&0&0&\tfrac12&0&0&\tfrac12&0\\
0&0&0&0&\tfrac13&0&\ttrac13&0-\tfrac13\\
0&0&0&0&0＆\tfrac12&0&\tfrac12-0\\
\结束{bmatrix}
\]解释这个矩阵的方法是$P_{ij}$是我们将从$i$转换到$j$的概率。这解释了为什么行的总和为1（矩阵为右旋橡胶).我们可以使用矩阵乘法巧妙地将这个事实表示为：$P\mathbf{1}=\mathbf{0}$，其中$\mathbf1}$和$\mat血红蛋白{1}$分别是全零和全一的列向量。数学上，我们可以通过矩阵乘法通过这个马尔可夫链传播概率分布。例如，如果我们在各州之间有一些初始分布$\mathbf｛a｝$
\[
\mathbf{a}^\mathsf{T}=\begin{bmatrix}\tfrac12&\tfrac12&0&0&0&0&0-0&0\end{bmatricx}
\]也就是说，我们很可能处于状态1或状态2。然后在下一步中，概率分布将使用
\[
\mathbf{b}^\mathsf{T}=\mathbf}a}^\mathsf{T} P（P）=\begin{bmatrix}\tfrac16&\tfrac14&\tfrac16&\tfrace4&\tfraca16&0&0&0结束{bmatricx}
\]因此，在下一步中，我们可能处于状态1、2、3、4、5中，并具有上述相关概率。

区分是很重要的状态例如$\{1,2，\dots，9\}$来自状态分布，这是概率向量，例如上面使用的$\mathbf{a}$和$\mathbf{b}$。如果跨州分布退化的，即完全集中在一个特定的状态$s$上，然后我将使用以下符号表示状态上的相应分布：
\[
\左（\mathbf{e} _秒\右）i=\begin{cases}1&\text{if}i=s\0&\text}otheric}\end{cases{
\]例如，$\mathbf{e} 2个^\mathsf{T}=\begin{bmatrix}0&1&0&0&0-0&0\end{bmatricx}$。

停止时间

我们对预期的击球时间，这是从某个初始状态$s$到某个目标状态$t\in\mathcal{t}$的平均步骤数。为了保持这种通用性，我假设可以有多个目标状态，由集合$\mathcal{T}$表示。让我们定义$\mathbf{q} _秒$是从状态$s$到终端集$\mathcal{T}$中任何状态的预期命中时间。结果是$\mathbf{q}$满足递归关系：
\[
\马特布夫{q} _秒=\开始{cases}
0&\text{if}s\in\mathcal{T}\\
1+\sum_｛i｝P_｛si｝\mathbf{q} _ i&\text{否则}
\结束{cases}
\]第一种情况很清楚：如果我们从终端集合开始，那么我们已经到达了，所以命中时间为零。如果我们在终端集之外，那么预期的命中时间将是$1$加上下一个过渡后我们最终到达的位置的命中时间的加权总和。上面的递归本质上是贝尔曼方程从动态规划.

定义向量$\mathbf{t} _ i=\begin{cases}0&\text{if}i\in\mathcal{T}\\1&\text}otherwise}\end{cases{$。
我们可以用简明的向量形式将上述方程改写为：
\[
\mathbf{q}=\textrm{diag}（\tathbf{t}）\left（\tatbf{1}+P\tathbf{q}\right）
\]利用$\textrm{diag}（\mathbf{t}）\mathbf{1}=\mathbf-{t}$这一事实，我们可以进一步简化并获得：
\[
\左（I-\textrm{diag}（\mathbf{t}）P\right）\mathbf{q}=\mathbf1}
\]对于一只鸭子的情况，如果我们将终端集设置为$\mathcal{T}=\{5\}$，那么我们将上面的$\mathbf{T}=\begin{bmatrix}1&1&0&1&1\end{bmatricx}^\mathsf{T}$替换为：
\[
\开始{bmatrix}
1&-\tfrac12&0&-\ttrac12&0&0&0&0\\
-\tfrac13&1&-\tfrac13&0&-\tfrac13&0&0&0&0\\
0&-\tfrac12&1&0&0-\tfrac12&0&0\\
-\tfrac13&0&0&1&-\tfrac13&0&-\tfrac13&0&0\\
0 & 0 & 0 & 0 & 1 & 0 & 0 & 0 & 0 \\
0&0&-\tfrac13&0&--\tfrac13&1&0&0-\tfrac3\\
0&0&0&-\tfrac12&0&0&1&-\ttrac12&0\\
0&0&0&0&-\tfrac13&0&-\frac13&1&-\trac13\\
0&0&0＆0&0&-\tfrac12&0&-\tfrac12&1\\
\结束{bmatrix}
\开始{bmatrix}\mathbf{q} _1个\vphantom{\tfrac12}\\mathbf{q} _2\vphantom{\tfrac12}\\mathbf{q} _3个\虚拟主机\\
\马特布夫{q} _4个\vphantom{\tfrac12}\\mathbf{q} _5个\vphantom{\tfrac12}\\mathbf{q} _6个\vphantom{\tfrac12}\\
\马特布夫{q} _7个\vphantom{\tfrac12}\\mathbf{q} _8个\vphantom{\tfrac12}\\mathbf{q} _9个\vphantom{\tfrac12}\end{bmatrix}
=\开始{bmatrix}
1\vphantom{\tfrac12}\\1\vphantom{\tfrac12}\\1\vphantom{\tfraca12}\\2\vphantiom{\tflac12}\\
0\vphantom{\tfrac12}\\1\vphantom{\tfraca12}\\1\vphantiom{\tfrac12}\\1
\结束{bmatrix}
\]反转此矩阵并求解$\mathbf{q}$，以下是数组形式的结果：
\[
\开始{array}{c|c|c}\hline
\马特布夫{q} _1个=6&\mathbf{q} 2个=5&\mathbf{q} _3个=6线
\马特布夫{q} _4个=5&\mathbf{q} _5个=0&\mathbf{q} _6个=5线
\马特布夫{q} _7个=6&\mathbf{q} _8个=5&\mathbf{q} _9个=6 \\\行
\结束{数组}
\]因此，如果我们从节点1开始，平均需要6次移动才能到达节点5。显然，预期的命中时间应该是整数，因为它们表示无限多条可能路径上的平均路径长度。在这种情况下，它们只是整数。这里观察到的对称性也有意义，我们可以利用它将问题简化为只有3个状态的马尔可夫链，但我将把它留给读者练习！（我从一开始就没有这样做的原因是，我想简单地推广到多鸭子的情况，那里的对称性更复杂）。

我们从原点开始的变量如何，但我们想知道返回原点需要多少时间？在这种情况下，我们只需从第二步开始计算，然后在答案中加上1即可解释跳过的动作。如果我们从节点5开始，即我们的初始分布是$\mathbf{e} _5个^\mathsf{T}$，那么第二回合的分配是$\mathbf{e} _5个^\mathsf{T}P$，因此从5开始并返回到5的预期移动次数为：$\mathbf{e} _5个^\mathsf{T}P\mathbf{q}+1=6$。

两只鸭子

乍一看，两杯咖啡的版本可能比一杯咖啡的更具挑战性。正如我们将看到的那样，一旦我们正确看待问题，问题基本上是一样的。关键是想象一个马尔可夫链，其中状态不是${1,2，点，9}$，而是${（1,1），（1,2），点，（9,9）}$。换句话说，有81个状态，由所有可能的对$（s_1，s_2）$组成，其中$s_i\In\{1,2，\dots，9\}$是鸭子$i$的位置。

这种马尔可夫链的转移矩阵是什么？转换概率$（a_1，a_2）\到（b_1，b_2）$简单地是$P_{a_1，b_1}P_{a_2，b_2}$，即每个鸭子的相应转换概率的乘积。这意味着如果我们先按照第一只鸭子来排列我们的州(字典序)，则该增广马尔可夫链的转移矩阵为$P\otimesP$，其中$\otime$是克罗内克产品.

所以我们可以用非常相似的方式解决这个问题。这一次，我们的终端集由所有节点$（s_1，s_2）$组成，其中$s_1=s_2$。有9个这样的节点，我们可以通过计算$\mathbf{t}=\mathbf来形成关联的$\mathbf{t{${1}-\textrm{vec}（I）$，其中$\mathrm{vec{$是矢量化的通过枚举列获得的矩阵版本。例如：
\[
\mathrm{vec}\开始{bmatrix}一个_{11} &a_｛12｝&a_｛13｝\\
a{21}、a{22}和a{23}\\
a{31}、a{32}和a{33}
\结束{bmatrix}=
\开始{bmatrix}
a{11}\\a{21}\\a{31}\\ a{12}\\a{22}\\a{32}\\a_a{13}\\a_23}\\a_{33}\\end{bmatrix}
\]$\mathcal{q}$的新方程是$\bigl可以按照与单鸭子案例中相同的逻辑进行计算。即$\mathbf{电子}_{（5,5）}^\mathsf{T}（P\otimesP）\mathbf{q}+1$。

注意事项

虽然这似乎是一个简单的代数，但我忽略了一个主要问题：可逆性。当我们在单鸭子情况下求解$\mathbf{q}$的方程时，方程看起来像$A\mathbf{q}=\mathbf-{t}$，解是$\mathbf{q{=A^{-1}\mathbf1{t}$。但如果$A$不是可逆的呢？这对应于马尔可夫链未连接的情况。因此，如果你从一个岛出发，而终点站在另一个岛上，你永远不会到达那里；停止时间是无限的。这不会发生在一只鸭子身上，但它做发生在两只鸭子身上！这是因为每次鸭子移动到一块新石头上时，石头的奇数变为偶数，反之亦然。因此，如果一只鸭子从岩石1开始，另一只从岩石2开始，它们会从未见面。

从线性代数的观点来看，这仅仅意味着即使矩阵不可逆，如果我们将注意力限制在两个鸭子具有相同奇偶性的“岛”（即子空间）上，那么该岛的相关转移矩阵将是可逆的，一切都会好起来。从实际角度来看，上述方程仍然可以求解；我们只需要用伪逆，并忽略$\mathbf{q}$中两个组件具有不同奇偶校验的所有组件。稍后详细介绍…

计算

我使用以下Matlab代码计算结果：

%一只鸭子的转移矩阵P=[0 1/2 0 1/2 0 0 0 01/3 0 1/3 0 1/3 0  0  0  00 1/2 0  0  0 1/2 0  0  01/3 0  0  0 1/3 0 1/3 0  00 1/4 0 1/4 0 1/4 0 1/4 00  0 1/3 0 1/3 0  0  0 1/30  0  0 1/2 0  0  0 1/2 00  0  0  0 1/3 0 1/3 0 1/30  0  0  0  0 1/2 0 1/2 0 ];T=克朗（P，P）；%过渡矩阵t=1-vec（眼睛（9））；%终端状态%起始分布s=克朗（[0 0 0 0 1 0 0 0]，[0 0.0 0 1 0.0 0]）'；%将停止时间计算为有理数stop_time=s'*T*（（眼睛（81）-诊断（T）*T）\T）+1大鼠（停止时间）

由此产生的预期停止时间为$\frac{363}{74}$，或大约4.905$步。我们还可以通过模拟找到近似答案。以下是通过模拟一百万次试验得到的结果：

概率的交错减少是一种实际效果；这不是近似误差的结果！

许多鸭子

如果我们有$n$ducks，我们可以很明显地概括上面使用的方法。这一次，转换矩阵将是$\下大括号{P\otimes\cdots\otimesP}_{n\text{times}}$。这里的问题是，我们的转换矩阵将非常大：精确地说，$9^n乘以9^n$。减少州数的一种方法是回到平等的概念。我们的转换矩阵之所以很大，是因为它描述了全部的所有可能的鸭子配置之间的转换。因为我们知道所有鸭子都从同一个节点开始，并且奇偶校验将被保留，所以我们只需要担心所有鸭子具有相同奇偶校验的状态子集。也就是说，将有$5^n$奇数状态和$4^n$偶数状态。所以我们可以把自己限制在一个较小的$（5^n+4^n）\次（5^n+4 ^n）$转换矩阵。这仍然很大，但这是一个改进。我们还将利用转移矩阵是稀疏的这一事实，这将有助于计算。

完成所有这些工作后，我们得到了以下结果（最多6只鸭子）：

这些值如下：

鸭子的数量	预计rendez-vous时间
2	4.9054
三	18.4360
4	66.7420
5	237.3955
6	825.3364

很明显，预期的rendez-vous时间呈指数级增长，但我还没有找到一种实用的方法来近似或约束它。不幸的是，很难将我的方法扩展到$n=6$ducks之外。为了让您了解规模，我们简单的转换矩阵应该有$9^6=531441$行和列。经过我们的缩减程序，我们降到了5^6+4^6=19721$。转换矩阵是稀疏的（大约98.5%的条目是零），但仍有大约600万个非零条目，这使得计算$\mathbf{q}$成为一个挑战。

如果我们利用对称性，就可能进一步减少。假设我们有两只鸭子。如果我们不做任何削减，则有9^2=81$个州。如果我们使用偶数/奇数奇偶校验进行缩减，则会降至$5^2+4^2=41$。

从停止时间的角度来看，唯一重要的是每块石头上有多少只鸭子；哪只鸭子在哪块石头上并不重要。这立即使我们可以将$5^n+4^n$减少到${n+4\choose4}+{n+3\choose 3}$，这是一个显著的改进。在两个月的情况下，这使我们达到25美元。
更深层的对称性也会出现。例如，通过旋转对称性，1和3上的一对鸭子相当于7和9上的一双鸭子。在两周的情况下，这将我们带到$8$的州。计算和记账这些状态可能需要一些群论…

最终，这些减少将产生显著效果，将缩放比例从指数减少到多项式。我没有实施任何额外的削减，因为在这一点上（最高$n=6$），指数趋势是明确的。我不认为进一步扩大这一趋势会特别有启发性。

关于“疯狂鸭子”的四点思考

盖伊·D·摩尔 说：

2020年1月20日上午6:48

劳伦特，你好，
很不错的。你的方法比我的方法优雅得多。
我的方法有点不同，我建立了一个福克-普朗克方程，从一个初始配置演化到每个连续配置的概率，去掉了鸭子再次加入的情况，我得到了相同的答案。

关于近似答案：
对于大量的鸭子，你可以想象，在移动之前，鸭子“随机”分布在给定奇偶校验的点之间，然后计算它们全部收敛到同一点的概率。
当鸭子处于4个边缘状态（符号中为2、4、6、8）时，每只鸭子有1/3的机会到达中间（5），还有1/6的机会到达给定的角落（1、3、7、9）。因此，他们都走到中间的机会是1/3^N，他们都走到同一个角落的机会是4/6^N（4个角落有4个）。
当鸭子处于奇数状态时，每只鸭子都有1/4的机会到达给定的边，因此它们都有1/4 ^N的机会到达（2），而（4,6,8）中的每一只鸭子有相同的机会，它们在下一次移动中会聚的总机会为4/4^N。
对这两种情况进行平均，在给定的移动中“完成”的机会是
（1/3北纬+4/6北纬+4/4北纬）/2
平均移动次数为
2/（1/3北纬+4/6北纬+4/4北纬）
即：
N=2时为4.235
N=3时为16.94
N=4时为64.40
N=5时为234.31
N=6时为821.68
N=7时为2794.56
等（渐进地，增加一只鸭子会使过程延长3倍）
当然，这并不准确：每只鸭子的位置是相关的，而不是完全随机的。但对于较大的N，相关性很小，近似值更好。我很惊讶它对N=2已经起到了多么好的作用…

答复
赫克托 说：

2020年1月20日下午1:01

我和你做的一模一样，盖伊。在并排到不并排的过渡中，所有鸭子都有1/3^N的机会在中心相遇，所以预期所有鸭子在中心的第一次相遇是2*3^N。对于较大的N，所有在其他地方相遇的鸭子与在中心相遇相比变得几乎不可能，所以这似乎是极限期望，对于N>10，这已经是一个很好的近似值。（见链接处的图。）

答复
天说：

2020年1月29日晚上9:29

很高兴看到一些新帖子-我差点以为我在这里看到了一些Julia代码😉

此外，很好地理解周期性行为的问题。这很麻烦，我倾向于将问题调整为一个惰性链（$\delta\in（0,1）$so$P'：=\deltaI+（1-\delta）P$），或者可能查看集合平均值。当我第一次读到这个问题时，我希望能有一个克罗内克的产品结构，但我认为这太好了，不可能是真的。

还有一些其他的东西，这是一个可逆的马尔可夫链，在这个特殊的情况下，给定状态的稳定概率向量入口与它的连接数成正比，对于单鸭子的情况是$\{\frac{1}{12}，\frac}{8}，\frac{1}}{6}}$。

最后一件事，因为$\pi_i=\frac{1}{\bar{X_i}}$，即perron/稳态向量的概率是由给定状态i开始时返回状态i的预期时间的倒数给出的，*并且*克罗内克积在特征值和特征向量方面具有很好的特性，我们可以说在$n$duck情况下，如果他们都在同一个位置开始，那么他们在同一位置再次见面的预期时间是${12^n，8^n，6^n}$。我想这给出了一个非常粗略的上限，对于这个Riddler中考虑的更一般的情况（即在某个任意的盒子中会面），在rendez-vous之前的预期时间

答复
1. 天说：
  
  2020年1月30日下午3:22
  
  当我们对任何$\delta\in（0,1）$使用$P'：=\deltaI+（1-\delta）P$时，这个问题在概念上很好。但是$\delta:=0$的原始问题有很多奇怪的行为。从代数上讲，奇数来自于特征值为+1和-1，所以当我们做一个kron乘积时，我们有由$1\cdot 1=1$和$1\cdot-1=1$给出的最大特征值，当我们kron生成3个矩阵时，我们也有$1\cdote1\cdot 1=1$和$1\ cdot-1=1$，还有$1\cdot-1\cdot-1=1$以及$1\cdlot-1=1$和$-1\cdote-1\cdot 1=1$，对于更高级别的kronecker产品，依此类推。特征值1的$k$个拷贝告诉我们这里有k个不相交的递归图（perron frobenius）。每个不相交图都有其自己的实非负特征向量，该实非负特征向量与与其他图/递归类相关联的其他特征向量不相交（正交）。因此，当我们使某个状态（比如“中间”状态）成为吸收状态时，这不会“击中”特征值为1的特征向量的k-1。这个问题也很好地说明了伪逆一般不是连续的，但实际逆（当$\delta\in（0,1）$）是连续的。非懒惰链（即所述问题）实际上是不可能的，因为当我们将周期性（一个通信类的不止一个特征值和一个模）与kronecker乘积混合时会发生什么。
  
  答复