条件(概率)

来自Citizendium
跳转到导航 跳转到搜索
这篇文章正在开发中,尚未获得批准。
主要文章
讨论
相关文章 [?]
参考文献 [?]
外部链接 [?]
可引用版本 [?]
 
此可编辑的主要文章是正在开发中并受免责声明.

信念取决于可用信息。这个想法在概率论通过条件作用.有条件概率,有条件期望和有条件分配分三个级别进行处理:离散概率,概率密度函数、和测量理论.如果条件完全指定,则条件会导致非随机结果;否则,如果条件是随机的,条件作用的结果也是随机的。

这篇文章集中讨论了各种条件作用之间的相互关系,主要通过例子来说明。

离散水平的调节

例子。一枚公平的硬币被掷了10次;这个随机变量 是这10次投掷中的头部数量,以及-前三次投掷中的头球数。尽管事实上出现在之前可能有人知道但不是.

条件概率

鉴于此事件的条件概率一般来说,

对于否则(对于),也可以将条件概率视为随机变量,即随机变量的函数即,

这个期望这个随机变量的概率等于(无条件的)概率,

即,

它是全概率定律

因此,可以被视为随机变量的值对应于另一方面,定义明确,不考虑其他可能的值.

有条件的期望

鉴于此随机变量的条件期望一般来说,

对于(在本例中,它似乎是一个线性函数,但通常是非线性的。)人们也可以将条件期望视为随机变量,即随机变量的函数即,

这个随机变量的期望值等于,

即,

或者简单地

它是总期望定律

随机变量是最佳预测鉴于也就是说,它最小化了均方误差关于形式的所有随机变量类这类随机变量保持不变,如果被替换为因此,这并不意味着相反,特别地,一般来说,对于每个功能这是所有可能值的集合上的一对一。的值无关;重要的是分区(表示为α)

样本空间的成不相交集(此处所有可能的值都是.)给定任意分区属于,可以定义随机变量尽管如此,

条件概率可以被视为条件期望的一个特例。也就是说,如果指示器属于因此,条件概率也取决于分区由生成而不是打开自身;

另一方面,对事件的条件作用定义明确,前提是不考虑任何可能包含作为几个部分之一。

条件分布

鉴于的条件分布

对于它是超几何分布 或同等标准,相应的期望由通用公式得出对于只不过是有条件的期望

治疗作为随机分布(四维空间中所有测度的随机向量人们可以接受它的期望,得到,-该二项分布 这一事实等于平等

对于这就是总概率定律。

密度水平调节

例子。球体的一个点根据球体上的均匀分布随机选择。随机变量,,是随机点的坐标。接头密度,,不存在(因为球体的体积为零),但关节密度属于,存在,

(密度是非恒定的,因为球体和平面之间存在非恒定的角度。)可以通过积分计算,

令人惊讶的是,结果并不取决于in(-1,1),

也就是说均匀分布在同样适用于(事实上,为了无论何时

条件概率

计算

鉴于此事件的条件概率是条件密度的积分,

一般来说,

为所有人这样的话(否则为分母消失)和(否则条件概率退化为0或1)。也可以将条件概率视为随机变量,即随机变量的函数即,

该随机变量的期望值等于(无条件)概率,

它是全概率定律

解释

条件概率不能解释为因为后者给出了0/0。因此,无法通过经验频率进行解释,因为精确值没有机会随机出现,甚至在无限序列的独立试验中也不会出现一次。

条件概率可以被解释为极限,

有条件的期望

条件期望没什么意思;它只是通过对称性消失。计算起来更有趣处理||作为的函数,:

一般来说,

对于也可以将条件期望视为随机变量,即随机变量X的函数,

这个随机变量的期望值等于

即,

它是总期望定律

随机变量是最佳预测鉴于也就是说,它最小化了均方误差关于形式的所有随机变量类与离散情况类似,对于每个可测函数那是一对一

条件分布

鉴于的条件分布,由密度给出是(重标的)arcsin分布;其累积分布函数为

为所有人这样的话相应的期望只不过是有条件的期望这个混合物所有条件分布(根据)是无条件分配这个事实等于相等

后者是全概率定律的实例上述.

什么是条件反射

在离散水平上,只有当条件的概率为非零(不能除以零)时,才可能进行条件处理。在密度水平上,调节即使这样也有可能这种成功可能会造成一种错觉,即条件反射总是可能。遗憾的是,事实并非如此,原因如下。

几何直觉:谨慎

结果上面提到的,在以下意义上是几何上明显的。要点球体的满足条件是一个圆半径的在飞机上不平等保持在弧上。弧的长度是圆长度的5/6,这就是条件概率等于5/6的原因。

这种成功的几何解释可能会造成以下问题微不足道的错觉。

给定球体的一个点是随机(一致)选择的。假设点位于给定平面上,它的条件分布是什么?

显然,条件分布必须在给定的圆(给定球体和给定平面的交点)上均匀。有时确实如此,但总的来说并非如此。特别是,均匀分布在并且与比率无关因此,另一方面,不平等保持在圆的圆弧上 (对于任何给定的). 弧的长度是圆长度的2/3。然而,条件概率是3/4,而不是2/3。这是经典Borel悖论的表现[1] [2].

“如果不将对称性形式化为不变性论证,那么对对称性的诉求可能会产生误导。”波拉德[3]

另一个例子。A类随机旋转三维空间的旋转是围绕随机轴以随机角度旋转。几何直觉表明,角度与轴无关,且均匀分布。然而,后者是错误的;角度值较小的可能性较小。

限制程序

给定一个事件零概率的公式没用,但是,你可以试试对于适当的事件序列非零概率(即,). 给出了一个示例在上面。另外两个例子是布朗桥与布朗远足.

在后两个例子中,由于只给出了一个事件(条件),所以总概率定律无关。相反,在这个例子中在上面全概率定律应用,自事件以来包含在一系列活动中哪里跑过这些事件是概率空间的一个分区。

为了避免矛盾(例如博雷尔悖论),应考虑以下重要区别。如前所述,如果给定事件具有非零概率,则对其进行条件处理是明确定义的(与任何其他事件无关)在上面相反,如果给定事件的概率为零,则除非提供了一些额外的输入,否则对它的条件是不确定的。这种额外输入的错误选择会导致错误的条件概率(期望值、分布)。从这个意义上说,“对于概率等于0的孤立假设,条件概率的概念是不可接受的。" (科尔莫戈罗夫; 引用于[3]).

附加输入可以是(a)对称(不变性组);(b) 一连串的事件这样的话 (c) 包含给定事件的分区。测量理论条件作用(下文)调查案例(c),揭示其与(b)的一般关系以及与(a)的关系(如适用)。

一些概率为零的事件超出了条件作用的范围。示例:let是均匀分布在上的独立随机变量事件“作为“;怎么样它倾向于1吗?另一个例子:let是均匀分布在上的随机变量事件“是有理数吗唯一的答案是,“关于概率等于0的孤立假设的条件概率的概念是不可接受的。”[3]).

测量理论层面的条件反射

例子。是均匀分布在上的随机变量哪里是给定的函数。以下对两例患者进行治疗:哪里是连续分段线性函数

无处不在是连续的,但无处不在Weierstrass函数.

几何直觉:谨慎

在这种情况下鉴于的两个值可能为0.25和0.5。很明显,这两个值的条件概率都是0.5,因为一个点与另一个点是一致的。然而,这是一种错觉;请参见下文。

条件概率

条件概率可以定义为指标的最佳预测值

给定X,即使均方误差最小关于形式的所有随机变量类

在这种情况下相应的函数可以明确计算,[4]

或者,可以使用限制程序,

给出了相同的结果。

因此,该随机变量的期望值等于(无条件)概率,即,

它是全概率定律

在这种情况下相应的函数可能无法明确计算。尽管如此,它仍然存在,并且可以用数值计算。事实上空间 在所有平方可积随机变量中希尔伯特空间; 指示器是该空间的向量;和形式的随机变量是一个(封闭的线性)子空间。这个向量到这个子空间的正交投影是明确定义的。它可以通过使用无限维希尔伯特空间的有限维近似值进行数值计算。

再次,随机变量的期望等于(无条件的)概率,即,

然而,希尔伯特空间方法处理作为函数的等价类而不是单个函数。可测量性确保了,但连续性(甚至黎曼可积性)不是。价值观是唯一确定的,因为点0.5是.其他值不是原子,因此对应的值不是唯一确定的。再一次,”对于概率等于0的孤立假设,条件概率的概念是不可接受的。“(科尔莫戈罗夫,引自[3]).

或者,使用相同的功能(顺其自然)可以定义为Radon-Nikodym衍生物

其中,度量μ、ν定义为

对于所有Borel集合也就是说,μ是,而ν是其条件分布的三分之一,

两种方法(通过希尔伯特空间和Radon-Nikodym导数)处理作为函数的等价类;两个功能被视为等效,如果几乎可以肯定。因此,条件概率被视为随机变量的等价类;像往常一样,如果两个随机变量几乎相等,则将其视为等价的。

有条件的期望

条件期望可以定义为鉴于也就是说,它最小化了均方误差关于形式的所有随机变量类

在这种情况下相应的函数可以明确计算,[5]

或者,可以使用限制程序,

给出了相同的结果。

因此,该随机变量的期望值等于(无条件)期望值,即,

它是总期望定律

在这种情况下相应的函数可能无法明确计算。尽管如此,它仍然存在,并且可以用与上面,-作为希尔伯特空间中的正交投影。总期望定律成立,因为投影不能通过属于子空间的常数函数1改变标量积。

或者,使用相同的功能(顺其自然)可以定义为Radon-Nikodym衍生物

何处测量由定义

对于所有Borel集合在这里是限制期望,不要与条件期望混淆

条件分布

在这种情况下有条件的累积分布函数可以显式计算,类似于限制程序给出

这不可能是正确的,因为累积分布函数必须右旋的!

这一矛盾的结果由测度理论解释如下。对于给定的相应的定义良好(通过希尔伯特空间或Radon-Nikodym导数)为函数的等价类). 被视为对于给定的除非提供了一些额外的输入,否则它是ill定义的。即函数(of)必须在每个(或至少几乎每个)等价类中选择。错误的选择导致错误的条件累积分布函数。

正确的选择如下。第一,被认为是有理数只有。(任何其他稠密可数集都可以同样好地使用。)因此,只使用等价类的可数集;这些类中所有函数的选择都是相互等价的,rational的相应函数定义明确(几乎每个). 其次,通过右连续性将函数从有理数推广到实数。

一般来说,条件分布是为几乎所有(根据),但有时结果是连续的,在这种情况下,可以接受单个值。在所考虑的示例中,情况就是这样;的正确结果

显示了鉴于由两个原子组成,分别为0.25和0.5,概率分别为1/3和2/3。

类似地,条件分布可以计算为在里面

价值观是原子的分布因此,相应的条件分布是明确定义的,可以通过初等方法进行计算(分母不为零);的条件分布鉴于是统一的测量理论得出了同样的结果。

所有条件分布的混合是.

条件期望只是关于条件分布的期望。

在这种情况下相应的可能无法明确计算。对于给定的它(通过希尔伯特空间或Radon-Nikodym导数)被定义为函数的等价类). 可以如上所述在这些等价类中正确选择函数;它可以得到正确的条件累积分布函数,从而得到条件分布。一般来说,条件分布不需要原子的绝对连续的(也不是这两种类型的混合物)。可能,在考虑的示例中,它们是单数的(就像康托分布).

再一次,所有条件分布的混合是(无条件)分布,条件期望是关于条件分布的期望。

笔记

  1. 波拉德2002,第节。5.5,第122页示例17
  2. 杜勒特1996,第节。4.1(a),第224页示例1.6
  3. 3 3.1 3.2 3.3 波拉德2002,第节。5.5,第122页
  4. 证明:
    需要注意的是最小值为
  5. 证明:需要注意的是最小值为最小值为

工具书类

  • 理查德·杜勒特(1996),概率:理论和示例(第二版)
  • David Pollard(2002),测量理论概率的用户指南,剑桥大学出版社