微生物繁殖

这个Riddler公司是关于微生物繁殖的。它们会茁壮成长还是灭绝?

在一开始,只有一种微生物。每天,这个物种的每一个成员要么分裂成自己的两个副本,要么死亡。如果繁殖的概率是p,那么这个物种灭绝的可能性有多大?

这是我的解决方案:
[显示解决方案]

这是一个更技术(更正确!)的解决方案,改编自Bojan的评论。
[显示解决方案]

关于“微生物繁殖”的20点思考

  1. 劳伦特,

    做得很优雅!你的解释中有一个小错误:这是因为概率必须小于或等于1(而不是说它必须是非负的),所以只有当p大于或等于1/2时,二次方程的第二个解才有意义。

    1. 嘿,Riddlers,我认为这里可能有更多的诡辩!的确,(1/p–1)仅是p大于或等于1/2的概率,但当然1也始终是概率。我们如何知道从概率1到(1/p–1)的转换发生在p=1/2而不是3/4,甚至正好发生在1?

      我不确定洛朗使用的技术(我承认我直到现在还认为这一技术很好)能否自行排除任何p的灭绝概率为1。任何p值的二次方都满足1;你得到的多项式方程也是如此,它们具有类似的动机,表示2、4、6等大小种群灭绝的概率。一旦你仔细想想,就不难明白为什么。这些方程说,灭绝的概率,比如说对于一个n大小的种群,是突然灭绝的1的加权混合(按概率(1-p)加权)^n) 以及种群接下来可能达到的不同非零大小的各种灭绝概率(通过达到这些大小的概率加权)。如果这些灭绝概率都是1,那么我们有一个权重为1的加权混合物,其权重总和为1,其总和为1。

      看来我们需要另一种见解?

      1. 说得好。当时我确实遇到过这种情况,而且我从来没有想过如何在$p>1/2$的情况下协调多个解决方案。我确实对这个问题进行了数值模拟,发现正如我在文章中指出的那样,解决方案在$p=1/2$处经历了一个转换……但我目前没有更好的见解。如果你有什么发现,请告诉我!

      2. 这里有一个论点,认为转变发生在p=1/2:假设我们有N个生物体。每个都有概率p变为2,概率1-p变为0;因此,预计第二天的生物体数量为2pN。因此,如果我们在第0天从一个有机体开始,第k天的期望值是(2p)^k。如果灭绝概率为1,那么期望值在很大程度上必须为零。这只发生在p<1/2的情况下。

        1. 很好!这使得曲线更容易理解。虽然对于所有p>1/2的情况,大k的预期种群都会达到无穷大,但这与灭绝的非零概率(甚至几乎可以肯定)是一致的。这很像圣彼得堡的“悖论”,在第n次抛硬币时,你第一次抛出尾巴就可以得到2^n美元(尽管你几乎可以肯定不会超过1000美元,但期望值是无限的)。

        2. 这是一个好主意,MarkS,但这里不太正确。你可能会遇到灭绝概率为1的情况,但预期的种群数量会无限大。(例如,如果所有生物在每个时间步长都一分为二,但每个时间步调都有灭绝的概率p。如果p为0,灭绝几乎肯定会发生。)在不深入度量理论细节的情况下,您需要一些附加条件来说明,如果灭绝概率为1,那么预期的种群数量必须为0。
          在这种情况下,可以将q_n定义为种群在n时刻灭绝的概率,然后得到相同的递归方程:q_n=(1-p)+pq_{n-1}^2。由于q_0=0,您可以通过归纳法证明,对于所有n,q_n<=1/p-1,因此q=lim q_n<=1/p-1。

  2. 你的博客总是很有启发性。我仍然对你用来解q的方程感到困惑,为什么要停在第一代而不包括第二代呢?

    1. 你好,加布里埃尔,

      在我的解中,$q$是物种最后灭绝了。因此,$q$已经考虑了所有后代。一种特定的微生物要灭绝,其所有后代最终都必须无法繁殖。关键的见解是,当一种微生物繁殖时,这两种新的微生物就像是从零开始的独立种群,因此每种微生物最终都有可能灭绝。

  3. 你好,

    对于$p>1/2$,确定二次方程“正确”解的另一种方法是明确计算任何一天的人口分布。说吧,
    \[
    Q_n(x)=\sum_{i=0}^\infty x^i\cdot(当天有}i\text{微生物的概率)。
    \]那么$Q_1(x)=x$,因为第一天只有一个生物体。并且,控制乘法/消法过程的递归关系是
    \[
    Q_{n+1}(x)=Q_n(px^2+(1-p))。\qquad\qquad(1)
    \]灭绝概率为$\lim_{n\to\infty}Q_n(0)$,可以很容易地显示为您所计算的值(使用$Q_1(x)=x$和$(1)$)。

    1. 这太棒了,谢谢!我用LaTeX重新格式化了你的评论(你以后可以直接在LaTeX中输入评论!)。我还在我的博客帖子中添加了一个额外的解决方案,灵感来自您的生成函数方法。可能有一种比我更直接的方法来推导动力学,但这仍然是一个有趣的练习。这种解决问题的方式清楚地表明了我们为什么要从一种解决方案过渡到另一种解决方法;这都是关于稳定与不稳定平衡的。

  4. 我有一些想法。

    首先,这个问题类似于莫斯特勒《概率论中的五十个挑战性问题》中的悬崖吊架(问题35)。甚至书中第53页的图表也与LL博客上的相同。我喜欢这本小书,所以我没有花那么多时间直接讨论这个问题。警告是,直接来说,在悬而未决问题的背景下,我要说的可能更有意义。

    第二个方面的一些评论,比如二次方程的哪根可以选择,我有两个想法。

    A) Mosteller在他的书中说,为了避免跳跃,LL博客中描绘的曲线必须采用$(1-p)/p$来表示$p\gt 1/2$。也就是说,选择哪个根可以简化为显示概率函数本身没有跳跃。

    B) 虽然我很喜欢莫斯特勒,但我建议至少考虑一种更简单的方法。

    我认为应该考虑使用“宽松”上限。我唯一的要求是避免$p=1$和$p=0$的退化情况。(我们可以从这些确定性案例中知道结果,而无需任何进一步的分析,只需目测即可。)

    第一步失败的概率是多少$1便士。当然,我们可以用…1-p来上界。在那之后尽快失败的概率是多少(即先上升一次,然后下降两次)。大多数人会说我们可以使用$p(1-p)^2$。我想让我们用$(1-p)^2$来上界。不是在第一个可行时间或第二个可行时间而是在第三个可行时间失败的概率如何?我想说让我们放松一下,这个上限是$(1-p)^3$。我想说,我们可以用$(1-p)^4$来上界下一个失败,用$(1-p)^k$来上限第k个失败。因此,在极限情况下,如果我们想要上限关于总失效概率,它由

    $y=(1-p)+(1-p$

    对于非退化概率,我们知道我们处于几何级数的收敛半径。因此,我们可以说,失效概率的*上限*为

    $y=压裂{1-p}{p}$

    将其绘制在图表上可能很有指导意义,但您可以清楚地看到,当$p\lt 0.5$时,此上界大于$1$。这个上限意味着当$p>0.5$时,我们可以安全地忽略1的根值。(当$p\geq 0.5$超出范围时,这个“宽松”上限等于下限。)

    1. 嗯……不知道这里发生了什么。似乎LaTeX中大于(但不是$\geq$)或小于符号(但不是$\leq$)会导致文本消失?

      为了清楚起见,我的最后一段应该是:
      – – – –
      将其绘制在图上可能很有指导意义,但您可以清楚地看到,当$p\geq0.5$时,该上界为$\leq1$,等式仅为p=0.5。这个上限意味着当p>0.5时,我们可以安全地忽略1的根值。(当p≥0.5时,这个“宽松”上界等于下界,这一事实超出了范围。)

      1. WordPress将小于和大于符号解释为html语法,这就是为什么它会导致问题。如果要在$\LaTeX$数学模式下使用该符号,只需分别对$\lt$和$\gt$使用\lt和\gt。我更新了你的原始帖子。

        谢谢你的评论!我在网上发现了莫斯特勒的悬崖吊架问题;基本上,这是一个随机行走问题,你以$p$的概率“离开”悬崖,以$1-p$的概率向悬崖“靠近”。问题是找出你最终会从悬崖上走下来的概率。在Cliffhanger问题中,你一次只走一步,但如果你只是假设微生物按顺序选择它们的个体命运,这就相当于微生物问题!非常整洁。

        1. 是的…。不过,我用几何级数进行定界的想法似乎需要一些工作。事实上,我再也不喜欢它了!

          这是漫长的一天。

        2. 感谢您在LaTeX上的留言。我太习惯于在Jupyter笔记本中键入LaTeX了,我完全忘记了与HTML发生符号冲突的可能性!
          – – – – –
          这里是另一种解决悬念问题的方法。它涉及到更多的机械,但我认为这个草图很好地分解了这个过程中发生的事情。很抱歉这么长,但我看到这里隐藏着一个投票问题,所以我不得不这么做!
          --––
          一如既往,我对退化概率不感兴趣,所以我再次断言$p\neq 0$和$p\neq 1$。我们可以直接查看这些案例。我还建议,我们可以把这个游戏(“悬而未决的游戏”)看作是一个有n+2个状态的有限迭代游戏:其中不同的状态是:$\{-1,0,1,2,…,n-1,n\}$,我们进行n次迭代。(例如,如果n=1,我们有状态{-1,0,1,},我们从状态0开始,进行1次迭代。)在所有情况下,我们都从状态0启动。如果我们在迭代期间访问状态$-1$,那么游戏就是失败的。

          最后一个摆出姿势的游戏询问$\lim_{n\to\infty}$会发生什么。请注意,官方问题只是建议从可数的无限状态开始,但我通常发现从有限状态开始并考虑限制过程可以帮助澄清您的想法。(我记得Jaynes会*坚持*我们会尝试这样做。)如果人们担心病理学,他们可以考虑从不同的方向接近这个极限进行确认。

          对于我的设置,有一些关于线性独立性的基本思想,并且需要在没有循环的情况下遍历图n次迭代的可能性,以激励此方法解决此问题。(也就是说,对于有限图,状态n实际上将被视为一个吸收状态。但由于我们总是从状态0开始,并且只允许n次迭代,因此除了最后一次迭代之外,我们永远不能在任何事情上达到状态n,所以从状态n开始的转移概率在设计上是不相关的。如果出于某种原因,我们从状态1开始,那么d、 我坚持认为,存在n次迭代的n+3状态……无论如何,转换需要适应不同的起点,或者不同的失败点非常简单。)

          这种方法的有趣之处在于它澄清了过程中发生的事情的机制——实际上它的行为就像一个分解。

          因此,首先考虑n次迭代后的预期位置。请注意,每次迭代的预期位置变化是$2p–1$,这里正在进行$n$i.i.d.过程。这并不是真正需要的,但我要提到的是,每次迭代的位置变化方差是由$4(p–p^2)$给出的。

          $\mu=n\big(1*p+-1*(1-p)\big)=n(2p-1)$给出了$n$迭代时的预期位置/漂移。类似地,我们可以说预期位置由$\mu=ExpectedUpSteps–ExpectedDownSteps$给出,其中$np=ExportedUpSteps$和$n(1-p)=expected DownSteps$。这一阶段可能需要比我在这篇文章中更谨慎的关注,以强调我还将关注$\bar X$,它是每次迭代的平均结果(又称$\frac{\mu}{n}$)。在大多数情况下,使用$\barX$比使用$\mu$更可取,因为它会收敛-但我会根据需要切换表示。我倾向于称$\mu$漂移和$\bar X$平均漂移。

          从这里我们可以使用强大数定律或弱大数定律,或均方误差收敛-这并不重要-请注意,随着n变大,出现除$\bar X$以外的平均移动大小的可能性极小。

          因此,我们可以将这个问题分解为$(a)$查看进程的平均漂移,$(b)$查看在中间步骤中达到状态$\{-1\}$的可能性。松散地说,$(a)$指的是长期行为,而$(b)$则指的是短期内发生的问题。我们的兴趣仅在于$n$变大时会发生什么(而不是,例如,这种收敛的速度)。

          由此,我们可以立即从公式$\bar X=(2p–1)\lt 0$中看出,如果$p\lt 0.5$。仅从$(a)$就可以看出,对于任何$p\lt 0.5$,当$n$变大时,失败的概率为1。最简单、最准确地说,如果我们的平均结果收敛于$\bar X$和$\bar X-lt 0$,那么这意味着在某一点上我们的样本路径中必须有大于+1的-1。这意味着一定发生了故障。$(b)$的复杂性与此无关。(我想在此强调的基本观点是,组件$(a)$给出的长期行为——平均漂移——主导并导致$p\lt 0.5$的失败。)
          – – – –

          现在考虑$p\geq 0.5$的情况。$p=0.5$情况表示零漂移,$p\gt 0.5$情况表示正漂移。在这些情况下,当n变大时,仅$\mu$不会导致失败,因此我们需要考虑$(b)$。有趣的是$(b)$是一个投票问题!换言之,我们可以在这里使用反射原理。草图如下:

          其中有$r=StepsDown$、$k=StepsUp$和$s=DownStepsTillFailureGivenStart$。注意我们的问题$s:=1$,但我会考虑一个更通用的公式。

          其思想是,对于任何给定的模型完整迭代,总计移动$=n=r+k$。有$\binom{n}{k}=\binom}r+k}{k{$种方法可以选择任何特定的移动顺序。因此,假设你处于某个特定的位置(特别是你的预期位置),失败的概率是由导致失败并使你达到你的位置的移动次数除以到达你的位置可能的方式总数得出的。

          这个公式是:$\binom{r+k}{r–s}\binom}r+k{k}^{-1}=\frac{\binom[r+k]{r–s}}{\binom{r+k}{k}}$

          因为在我们的例子中,$s$总是等于1(即我们总是从状态0开始,而故障距离我们只有一步之遥),所以我们可以将其重写为:

          $\binom{r+k}{r–1}\binom}r+k{k}^{-1}=\frac{k!r!}{(r–1)!(k+1)!}=\frac{r}{k+1}$

          因此,非负漂移情况下的失效概率公式为:$\frac{r}{k+1}$

          值得强调的是,对于选票问题,r和k的大小很重要!插入类似于$\bar X$而不是$\mu$的内容与投票问题的物理含义不符。它确实需要存在的“是”与“否”的总数(对于任何给定的n)。

          现在需要考虑的是,当n变大时,我们看到的概率为1的平均值为$\bar X$,我们可以将其分解为上升阶数和平均下降阶数的平均值。为了与投票问题的物理意义保持一致,我们将适当地放大这些值(即增加$n$)。因此,我们进行以下两项任务:

          $r:=预期下降步数=n(1-p)$

          $k:=预期上行数=np$

          $\frac{(r)}{(k)+1}=\frac}\big(n(1-p)\big)}{\ big(np\ big)+1}$。

          再次回顾,我已经在这篇文章中消除了退化概率,提取答案只需要一个简单的限制:

          $Probability{Failure}\big|p\geq 0.5=\lim_{n\to\infty}\frac{n(1-p)}{np+1}=\lim _{n\to \infty}\frac{(1-p$

          从这里开始,考虑$s$从给定的开始一直移动到失败的一般情况只需要做一点工作。对于任何自然数$s\geq 1$,此一般失效概率等于

          $Probability_{Failure}\big|p\geq 0.5=\lim_{n\to\infty}\frac{n^s(1-p)^s+O\big(n^{s-1}\big)}{n^sp^s+O \big}=\大(\frac{1-p}{p}\big)^s$

          – – – –

          希望这个观点是对LL关于这个问题的原始解决方案的补充,并对为什么在$p=0.5$时出现故障概率断点提供了一些额外的见解。我认为可能与生成函数方法有一些重叠,尽管我可能会尝试,生成函数并不是真正与我对话。我也很喜欢投票问题😉

        3. 很好!
          有趣的是,我没有找到一种直接的方法来证明Mosteller的Cliffhanger问题的二次方程的正确解。
          通过这个类比,以及对有机体问题的证明,我们也得到了悬崖吊架的完整解决方案。

          1. 顺便说一句:在我写作的最后,这里有一个技术上更仔细的方法来处理投票问题,当我说:
            $\binom{r+k}{r–1}\binom}r+k{k}^{-1}=\frac{k!r!}{(r–1)!(k+1)!}=\frac{r}{k+1}$

            或一般情况下
            $\binom{r+k}{r–s}\binom}r+k{k}^{-1}=\frac{k!r!}{(r–s)$

            从这里可以看到,我们正在为一系列修改过的bernouli试验进行投票($\{-1,1\}$vs$\{0,1\}$只是一个小的布尔修改)。但投票公式告诉我们的是,对于任何一系列的iid bernouli-ish试验,在固定的较低“淘汰”门槛下,随着$n$的增长,所有重要的是$r$和$s$之间的比率。那就是

            $\lim_{n\to\infty}\frac{r^s+O(r^{s-1})}{k^s+0(k^{s-1\}){=\big(\frac}{k}\big)^s$

            为了证明这一点,首先观察$n=k+r$,其中$k\geq 0$,$r\geq 0$。因此,要使$n$变大,$k$和$r$中至少有一个必须变大。然而,如果$k$或$r$之一变大,而另一个不变大,则会引发矛盾(或实际上是零概率事件)。(也许值得一提的是,在$r\gt k$的情况下,我们不需要投票问题的公式-很简单,如果$r\gtk$,那么你有一个负数,任何负数都表示失败。如果这是障碍期权的二项式期权定价模型,那么这个技术问题将通过if语句处理。在任何情况下,如果n变大,$p>0.5$,那么$\frac{r}{k}\geq1$的概率为零。)

            具体地说,根据弱大数定律,我们知道每$\epsilon\gt 0$的$\lim_{n\to\infty}Pr\big\{\big|SampleMean–\bar X\big| \gt\epsilon\big}=0$。因此,唯一的非零概率结果事件是当$k$和$r$随着$n$增长任意大(并且与它们各自的概率成比例)而变大时。

            因此,投票问题告诉我们的是,在限制范围内,$r$和$k$之间的相对比例才是最重要的。谢天谢地,我们知道这是烘烤成$\bar X$。这一点特别容易看到,因为我们有二元回报。同样,如果上升与下降的混合不是p和1-p,那么我们的样本平均值$\lim_{n\to\infty}$将不等于$\barX$。因此,我们可以将其替换为$\frac{r}{k}=\frac{1-p}{p}$,并考虑在一般情况下,任何自然数$s\geq1$的答案都是由$\Big(\frac{1-p}{p}\Big)^s$给出的。

  5. 你好,
    我相信我找到了一个类似但略为简单的解决方案:
    (我不会使用LaTeX,请随意编辑我的评论)

    首先,将q_n定义为在时间点n灭绝的概率。
    所以q_1=0,q_2=1-p。

    使用基本概率,我们得到(1):q_(n+1)=(1–p)+p*q_n^2
    大写:点n+1处的灭绝概率等于两个概率之和:
    A.第一个细胞立即死亡:1-p。
    B.第一个细胞存活下来,两个后代的继代培养物在其n:p*q_n*q_n点灭绝。

    现在我们找到了极限。

    首先,限制的存在是因为{q_n}正在增加并且有界(例如,由1)。
    极限必须满足x=(1–p)+p*x^2,因此它要么是1,要么是Q=1/p–1。

    现在为了证明当p>0.5时,极限只能是Q=1/p–1,我们注意到,通过归纳,{Q_n}由Q限定。

    就是这样。

留下回复

您的电子邮件地址将不会被发布。 已标记必填字段*