沃尔夫拉姆 计算符合知识

概率是多少?

“几率有多大?”这句话经常被用来指出看似巧合的事件,通常是作为一个反问句。大多数人甚至不会猜测;他们知道,隐含的答案通常是“非常苗条”

然而,我总是对这个问题着迷。我喜欢思考导致一种情况的事件,以及什么样的看不见的机制可能在起作用。我把这个问题解释为一个挑战,一个值得讨论的激动人心的话题。在某些情况下,可能性似乎无法计算,我承认这并不总是容易的。然而,对周围的数学进行快速调查可以给你很多见解。希望在阅读完这篇文章后,下次有人问你“什么可能性?”

但在我们深入讨论概率之前,重要的是要触及概率这一更普遍的话题。

概率论包含了许多关于随机事件如何发生的想法,包括许多从数学上描述这种现象的函数(分布)。虽然主题可能会变得相当复杂,但估计事件概率的基本策略包括计算可能的结果并确定每个结果发生的所有方式。

在抛硬币这个简单的例子中,这个过程几乎是微不足道的。只要硬币是“公平的”(即不以有利于特定结果的方式改变),每次都会出现正面或反面,并且每个结果只能以一种方式出现。您可以轻松创建硬币翻转函数来建模此行为:

coinFlip函数建模投币行为

现在想象一下两枚硬币的情况。每枚硬币正面或反面出现的几率仍然相同。现在有四种同样可能的结果:

硬币翻转结果

每个结果的概率为1/4或25%。但是,如果我们将两种混合情况(TH和HT)视为等效情况(即一头一尾),我们的解释就会改变。现在我们有1/4的机会得到两个头(或两个尾巴),2/4=1/2的机会得到一个头和一个尾巴:

掷硬币的概率

无论在哪种情况下,实际上在所有情况下,这些概率的总和都是1。还要注意的是,一排两个头的概率与每次投掷一个头的可能性的乘积是一样的:1/2*1/2=1/4。当预测一系列特定的事件时(在这种情况下,一个头部后面跟着另一个头部),概率会成倍增加。这意味着随着连续预测数量的增加,正确预测的概率会降低。这似乎很明智,因为没有人是对的全部的时间:

预测连续掷硬币的概率

用机会来解释概率是很常见的。1/4的概率可以理解为事件发生概率的1/4。事实上,许多人会引用这种数字作为事件发生的“概率”,尽管这在技术上是不正确的。以下是在五牌抽牌扑克中抽到任何可能的牌的机会:

五卡抽扑克的机会

奇数是一种在游戏和下注情况中经常使用的概率的稍微不同的表示。然而,概率表示为事件发生方式与全部的可能的结果,几率表示为事件发生次数的比率发生的方式与发生的方式不会的发生——输赢的对比。这可以表示为有利(赢/输)或不利(输/赢)的赔率:

赞成或反对的几率

在单掷硬币的例子中,正面着地的几率是1比1,两者都是抬起头(第一个1)或它不会的(第二个1)。在双掷硬币游戏中,你获得两个头的几率(上图中的HH)是3比1:

双掷硬币的赔率

由于两者都用简单数字的比率表示,机会和赔率表示法对非数学类型尤其有用。例如,最近赢得16亿美元Powerball头奖的机会为292201338中的1。换句话说,获胜的几率是292201337比1。这些赔率取决于抽签过程——从69个白球中选择5个,从26个动力球中选择1个。在这里二项式【n,k】是组合的Wolfram语言函数(选择的概率k个中的特定项目n个可用选项),获得全部5个白球的机会乘以获得Powerball的机会:

获得所有5个数字的几率

由于只有一种可能性(总共292201338种可能性中的一种)导致获胜,因此总的胜算是292201337比1。从长远来看,获得王室同花顺(扑克中最罕见的手牌)的几率要高得多。在大约250万只独特的手中,只有四种可能的方法可以得到这只手:

被王室同花顺的几率

显然,有近3亿种输球方式比有60万种输球更具吸引力。这么大的数字很容易理解为什么几率和机会经常互换——比率几乎完全相同,因为几乎所有的可能性都被视为损失。在这两种情况下,小比例的胜利意味着获胜的可能性很小。很简单,对吧?

在许多情况下,人们可能会遇到这种“赔率”表示法,但并不清楚这些数字是从哪里来的。一支球队赢得超级碗的几率有多大?虽然很容易找到这些数字的报价(五三八目前卡罗莱纳州队对丹佛队的比分为3比2),要想弄清楚他们是怎么来的要困难得多。

这给我们带来了另一个重要的主题:统计。事实证明,虽然随机事件很难预测,但长期趋势和模式会随着时间的推移而出现,这有助于形成我们的预测。统计学是收集和组织大量数据以创建模型的学科。

大多数运动项目中的团队和球员评级都是基于历史统计数据,如击球率、传球码、进球被阻挡等。由于运动(以及许多其他竞争性活动,如棋类游戏)是机会和技能的不稳定组合,因此通过随意观察往往很难确定趋势。这就是为什么赌博情况(最近日常幻想运动)通常会被那些既懂概率又懂统计的人扫地出门。

但现在,让我们回到我们的硬币上。根据直觉,任何一系列的抛硬币都应该是半正面、半反面的。为了测试这个假设,我们可以模拟一系列硬币翻转,总结结果:

模拟一系列掷硬币

结果各不相同,但通常很接近。这是为什么?

从数学上讲,你可以把掷硬币看作是在0(反面)和1(正面)之间的一个随机选择,期望你能在大约一半的时间内得到每个值。这使得预期值一枚硬币以1/2或0.5的速度翻转。

让我们使用此模型设置一个函数,以及可视化这些试验结果的方法:

使用模型设置函数

看一系列的十次或二十次翻转可能不够;每一次翻转都是独立的,所以很可能主要是正面翻转或主要是反面翻转:

十次或二十次翻转的系列

正如他们所说,这是任何人的猜测。然而,在将硬币翻转数百或数千次后,您将开始注意到数据汇聚在一个模式上:

100、500、1000次翻转系列

在本系列中,您将看到所谓的大数定律,表示特定系统中重复试验的平均值(实线蓝色)应趋向于单个试验的预期值(虚线红色)。在这种情况下,您应该得到大约0.5的平均值,这是一个由图表清楚显示的趋势。

这里的结论是,系统的长期行为比任何小规模效应都重要得多。此外,无论短期趋势如何,下一次出现正面翻转的概率仍然只有50%。人们错误地认为,一段时间频繁的“正面”结果会增加下次“反面”的机会,这就是所谓的赌徒谬论。

体育迷们可能熟悉一个相关的陷阱:当运动员在某场比赛中出现“连胜”时,许多球迷倾向于相信这种连胜会继续下去(好像是由于某种宇宙动力)。大多数情况下,情况并非如此,这可能对试图预测结果的人有害。这在一定程度上是因为对多个事件的预测还必须考虑事件是否相关,或者从数学角度来说,变量是否独立的.

在我们的硬币例子中,很明显,一次翻转的结果不应该影响下一次。在更复杂的情况下,可能不容易判断。

例如,考虑精算科学。保险业将其整个模型建立在对各种活动所涉及的风险进行评估的基础上。他们通过筛选大量数据来寻找风险行为的长期模式。精算师的工作是知道你更有可能被闪电击中比到死于飞机失事(不过,幸运的是,我们已经Wolfram|Alpha公司为此)。尽管这一领域看似病态,但它增加了我们对风险的集体理解。事实上,这些风险评估模型通常可以塑造政府政策.

当然,统计数据不必太严肃。你可以试着估计一些真正有趣的事情发生的可能性,比如银河系中的外星生命或者计算房间里至少两个人的几率分享生日(派对上的最爱)。可能性是无穷无尽的,所以你很快就会用完想法的可能性很低。

下载这篇文章作为可计算文档格式(CDF)文件。

评论

加入讨论

!请输入您的评论(至少5个字符)。

!请输入您的姓名。

!请输入有效的电子邮件地址。

4条评论

  1. 很棒的信息。幸运的是,我偶然发现了你的网站。
    我已将其保存为收藏夹,供以后使用!

    答复
  2. 如果你用这个来计算某匹马在某一天赢得比赛的机会,也有一个宇宙联系。
    一匹有赛马号码的马说,在5的倍数为5的日子里,5赢得了更多的比赛。那是在5号、10号、15号,依此类推。你必须翻阅表格才能看到这些证据。它就在那里。
    我们该如何解释呢?

    答复