条件（概率）

离散水平的调节

例子。一枚公平的硬币被掷了10次；这个随机变量 ${\显示样式X}$ 是这10次投掷中的头部数量，以及 ${\显示样式Y}$ -前三次投掷中的头球数。尽管事实上 ${\显示样式Y}$ 出现在之前 ${\显示样式X}$ 可能有人知道 ${\显示样式X}$ 但不是 ${\显示样式Y}$ .

条件概率

鉴于此 ${\显示样式X=1，}$ 事件的条件概率 ${\显示样式Y=0}$ 是 ${\显示样式P（Y=0|X=1）=P（Y=0.，X=1$ 一般来说，

{\displaystyle\mathbb{P}（Y=0|X=X）={\frac{\binom{7}{X}}{\binom{10}{X{}}={\frac{7！（10-X）！}{（7-X）！10！}}}

对于 ${\显示样式x=0,1,2,3,4,5,6,7；}$ 否则（对于 ${\显示样式x=8,9,10}$ ), ${\显示样式P（Y=0|X=X）=0.}$ 也可以将条件概率视为随机变量，即随机变量的函数 ${\显示样式X}$ 即，

{\displaystyle\mathbb{P}（Y=0|X）={\begin{cases}{\binom{7}{X}}/{\binom{10}{X{}}&{\text{for}X\leq7，\\0&{text{for}X>7

这个期望这个随机变量的概率等于（无条件的）概率，

{\displaystyle\mathbb{E}（\mathbb}P}（Y=0|X））=\sum_{X}\mathbb{P}

即，

{\displaystyle\sum_{x=0}^{7}{\frac{\binom{7}}{\binom{10}{x}}}\cdot{\frac{1}{2^{10}}{

它是全概率定律 ${\显示样式E（P（A|X））=P（A）.}$

因此， ${\显示样式P（Y=0|X=1）}$ 可以被视为随机变量的值 ${\显示样式P（Y=0|X）}$ 对应于 ${\显示样式X=1.}$ 另一方面， ${\显示样式P（Y=0|X=1）}$ 定义明确，不考虑其他可能的值 ${\显示样式X}$ .

有条件的期望

鉴于此 ${\显示样式X=1，}$ 随机变量的条件期望 ${\显示样式Y}$ 是 ${\显示样式E（Y|X=1）=0.3.}$ 一般来说，

{\displaystyle\mathbb{E}（Y|X=X）={\frac{3}{10}}X}

对于 ${\显示样式x=0，…，10.}$ （在本例中，它似乎是一个线性函数，但通常是非线性的。）人们也可以将条件期望视为随机变量，即随机变量的函数 ${\显示样式X}$ 即，

{\displaystyle\mathbb{E}（Y|X）={\frac{3}{10}}X}

这个随机变量的期望值等于 ${\显示样式Y}$ ,

｛\displaystyle\mathbb｛E｝（\mathbb｛E｝（Y|X））=\sum_｛X｝\mathbb｛E｝（Y|X=X）\mathbb｛P｝（X=X）=\mathbb｛E｝（Y），｝

即，

{\displaystyle\sum_{x=0}^{10}{\frac{3}{10}}x\cdot{1}{2^{10{}}{\binom{10}{x}}={\frac{3}{2}}\，，}

或者简单地

{\显示样式\mathbb{E}{\大（}{\frac{3}{10}}X{\Big）}={\frac{3}}{10{}}\mathbb{E}（X）={\frac{3{10}{cdot 5={\frac{3}{2}}\，，}

它是总期望定律 ${\显示样式E（E（Y|X））=E（Y）.}$

随机变量 ${\显示样式E（Y|X）}$ 是最佳预测 ${\显示样式Y}$ 鉴于 ${\显示样式X}$ 也就是说，它最小化了均方误差 ${\显示样式E（Y-f（X））^{2}}$ 关于形式的所有随机变量类 ${\显示样式f（X）.}$ 这类随机变量保持不变，如果 ${\显示样式X}$ 被替换为 ${\显示样式2X.}$ 因此， ${\显示样式E（Y|2X）=E（Y=X）。}$ 这并不意味着 ${\显示样式E（Y|2X）=0.3\cdot 2X；}$ 相反， ${\显示样式E（Y|2X）=0.15\cdot 2X=0.3X.}$ 特别地， ${\显示样式E（Y|2X=2）=0.3.}$ 一般来说， $｛\displaystyle E（Y|g（X））=E（Y|X）｝$ 对于每个功能 ${\显示样式g}$ 这是所有可能值的集合上的一对一 ${\显示样式X}$ 。的值 ${\显示样式X}$ 无关；重要的是分区（表示为α_{${\显示样式X}$})

{\displaystyle\Omega=\{X=X_{1}\}\uplus\{X=X_{2}\}\ uplus\dots}

样本空间的 ${\显示样式\Omega}$ 成不相交集 ${\显示样式\{X=X_{n}\}.}$ （此处 ${\显示样式x{1}、x{2}、\点}$ 所有可能的值都是 ${\显示样式X}$ .）给定任意分区 ${\显示样式\alpha}$ 属于 ${\显示样式\Omega}$ ，可以定义随机变量 ${\显示样式E（Y|\alpha）。}$ 尽管如此， ${\显示样式E（E（Y|\alpha））=E（Y）。}$

条件概率可以被视为条件期望的一个特例。也就是说， ${\显示样式P（A|X）=E（Y|X）}$ 如果 ${\显示样式Y}$ 是指示器属于 $｛\displaystyle A｝$ 因此，条件概率也取决于分区 ${\显示样式\alpha_{X}}$ 由生成 ${\显示样式X}$ 而不是打开 ${\显示样式X}$ 自身； ${\显示样式P（A|g（X））=P（A=X）=P$ ${\displaystyle\alpha=\alpha_{X}=\alfa_{g（X）}.}$

另一方面，对事件的条件作用 ${\显示样式B}$ 定义明确，前提是 ${\显示样式P（B）\neq 0，}$ 不考虑任何可能包含 ${\显示样式B}$ 作为几个部分之一。

条件分布

鉴于 ${\显示样式X=X，}$ 的条件分布 ${\显示样式Y}$ 是

{\displaystyle\mathbb{P}（Y=Y|X=X）={\frac{{\binom{3}{Y}}{\binom{7}{X-Y}}}{\ binom{10}{X}}}={\frac{{\ binom{X}{Y{}}{

对于 ${\显示样式0\leqy\leqmin（3，x）.}$ 它是超几何分布 $｛\displaystyle\mathrm｛H｝（x；3,7），｝$ 或同等标准， $｛\displaystyle\mathrm｛H｝（3；x，10-x）。｝$ 相应的期望 ${\显示样式0.3x，}$ 由通用公式得出 ${\显示样式n{\压裂{R}{R+W}}}$ 对于 ${\显示样式H（n；R，W），}$ 只不过是有条件的期望 ${\显示样式E（Y|X=X）=0.3x.}$

治疗 ${\显示样式H（X；3,7）}$ 作为随机分布（四维空间中所有测度的随机向量 ${\显示样式{0,1,2,3\}），}$ 人们可以接受它的期望，得到 ${\显示样式Y}$ ，-该二项分布 $｛\displaystyle\mathrm｛Bin｝（3,0.5）。｝$ 这一事实等于平等

{\displaystyle\sum_{x=0}^{10}\mathbb{P}（Y=Y|x=x）\mathbb2}（x=x

对于 ${\显示样式y=0,1,2,3；}$ 这就是总概率定律。

密度水平调节

例子。球体的一个点 $｛\displaystyle x^｛2｝+y^｛2｝+z^｛2｝=1｝$ 根据球体上的均匀分布随机选择。随机变量 ${\显示样式X}$ , ${\显示样式Y}$ , ${\显示样式Z}$ 是随机点的坐标。接头密度 ${\显示样式X}$ , ${\显示样式Y}$ , ${\显示样式Z}$ 不存在（因为球体的体积为零），但关节密度 ${\显示样式f_{X，Y}}$ 属于 ${\显示样式X}$ , ${\显示样式Y}$ 存在，

f_{X，Y}（X，Y）={\begin{cases}{\frac{1}{2\pi{\sqrt{1-X^{2} -年^{2} }}}}&{\text{if}}x^{2}+y^{2{<1，\\0&{text{otheric}}。\结束{cases}}

（密度是非恒定的，因为球体和平面之间存在非恒定的角度。） ${\显示样式X}$ 可以通过积分计算，

f_{X}（X）=\int_{-\infty}^{+\infty}f_{X，Y}（X，Y）^{2} -年^{2}}}}}\,;

令人惊讶的是，结果并不取决于 ${\显示样式x}$ in（-1,1），

{\显示样式f_{X}（X）={\开始｛案例｝0.5&｛\text｛for｝｝-1<x<1，\\0&｛\text｛otherwise｝｝，\end｛cases｝｝｝

也就是说 ${\显示样式X}$ 均匀分布在 ${\显示样式（-1,1）.}$ 同样适用于 ${\显示样式Y}$ 和 ${\显示样式Z}$ （事实上，为了 ${\显示样式aX+bY+cZ}$ 无论何时 $显示样式a^{2}+b^{2neneneep+c^{2{=1）。}$

条件概率

计算

鉴于此 ${\显示样式X=0.5，}$ 事件的条件概率 ${\显示样式Y\leq 0.75}$ 是条件密度的积分，

{\displaystyle{\begin{aligned}&f_{Y|X=0.5}（Y）={\frac{f_{X，Y}（0.5，Y）}{f_}X}；\结束{cases}}\\&\mathbb{P}（Y\leq 0.75|X=0.5）=\int_{-\infty}^{0.75}英尺_{Y|X=0.5}（Y）\，\mathrm{d}Y=\\&=\int_{-{\sqrt{0.75}}}^0.75}{\frac{\mathrm{d}Y}{\pi{\sqrt{0.75-Y^{2}}}}={\frac{1}{2}+{\frac:1}{\π}}\arcsin{\sqrt{075}}{6}，。\结束{对齐}}

一般来说，

{\displaystyle\mathbb{P}（Y\leqy|X=X）={\frac{1}{2}}+{\frac{1}}{\pi}}\arcsin{\frac:Y}{\sqrt{1-X^{2}{}}}}

为所有人 ${\显示样式x}$ 和 ${\显示样式y}$ 这样的话 $｛\displaystyle-1＜x＜1｝$ （否则为分母 ${\显示样式f_{X}（X）}$ 消失）和 ${\displaystyle\textstyle-{\sqrt{1-x^{2}}}$ （否则条件概率退化为0或1）。也可以将条件概率视为随机变量，即随机变量的函数 ${\显示样式X}$ 即，

{\displaystyle\mathbb{P}（Y\leqy|X）={\begin{案例}0&{text{for}X^{2}\geq 1-y^{2{text{and}y<0，\\{frac{1}{2}}+{frac}1}{\pi}}\arcsin{\frac{y}{\sqrt{1-X^{2]}}&{text{for}}X^}2}<1-y^}，\\1&{text}for}X^{2}}{2}{\text{and}y>0.\结束{cases}}}

该随机变量的期望值等于（无条件）概率，

{\displaystyle\mathbb{E}（\mathbb}P}（Y\leqy|X））=\int_{-\infty}^{+\infty}\mathbb{P}

它是全概率定律 ${\显示样式E（P（A|X））=P（A）.}$

解释

条件概率 ${\显示样式P（Y\leq 0.75|X=0.5）}$ 不能解释为 ${\显示样式P（Y\leq 0.75，X=0.5）/P（X=0.5$ 因为后者给出了0/0。因此， ${\显示样式P（Y\leq 0.75|X=0.5）}$ 无法通过经验频率进行解释，因为精确值 ${\显示样式X=0.5}$ 没有机会随机出现，甚至在无限序列的独立试验中也不会出现一次。

条件概率可以被解释为极限，

{\displaystyle{\begin{aligned}和\mathbb{P}（Y\leq0.75|X=0.5）=\lim_{\varepsilon\ to 0+}\mathbb{P}（Y\Leq0.75|1.5-\varepsilon<X<0.5+\varepsi lon）=\&=\lim _{\varepsilon\ to0+}{\frac{\mathbb2{P}（Y \leq 0.75,0.5-\varebsilon<X<0.5+\vareb）}{\mathbb{P}（0.5-\varepsilon<X<0.5+\varepsilon）}}=\\&=lim_{\varepsi lon到0+}{\frac{\int_{0.5-\varepsilon}^{0.5+\varepsilon}\mathrm{d}x\int__{-\infty}^{0.75}\mathr{d}y\，f_{x，y}（x，y）}{int_{0.5m-\varesilon}^{05+\varesilion}\mathrm{d{x\，f_{x}（x）}}，。\结束{对齐}}

有条件的期望

条件期望 ${\显示样式E（Y|X=0.5）}$ 没什么意思；它只是通过对称性消失。计算起来更有趣 ${\显示样式E（|Z||X=0.5）}$ 处理| ${\显示样式Z}$ |作为的函数 ${\显示样式X}$ , ${\显示样式Y}$ :

{\displaystyle{\begin{aligned}&|Z|=h（X，Y）={\sqrt{1-X^{2} -是^{2}}}\,;\\&\矩阵{E}（|Z||X=0.5）=\int_{-\infty}^{+\infty}h（0.5，y）f_{y|X=0.5}（y）^{2}}}}={\frac{2}{\pi}}{\sqrt{0.75}}\，。\结束{对齐}}

一般来说，

{\displaystyle\mathbb{E}（|Z||X=X）={\frac{2}{\pi}}{\sqrt{1-X^{2}}}}

对于 ${\显示样式-1<x<1.}$ 也可以将条件期望视为随机变量，即随机变量X的函数，

{\displaystyle\mathbb{E}（|Z||X）={\frac{2}{\pi}}{\sqrt{1-X^{2}}}\，.}

这个随机变量的期望值等于 ${\显示样式|Z|，}$

{\displaystyle\mathbb{E}（\mathbb}（|Z||X）

即，

{\displaystyle\int_{-1}^{+1}{\frac{2}{\pi}}{\sqrt{1-x^{2}}}\cdot{\frac{\mathrm{d}x}{2}}={\ frac{1}{2{}\，}

它是总期望定律 ${\显示样式E（E（Y|X））=E（Y）.}$

随机变量 ${\显示样式E（|Z||X）}$ 是最佳预测 ${\显示样式|Z|}$ 鉴于 ${\显示样式X}$ 也就是说，它最小化了均方误差 ${\显示样式E（|Z|-f（X））^{2}}$ 关于形式的所有随机变量类 ${\显示样式f（X）.}$ 与离散情况类似， ${\显示样式E（|Z||g（X））=E（|Z ||X）}$ 对于每个可测函数 ${\显示样式g}$ 那是一对一 ${\显示样式（-1,1）.}$

条件分布

鉴于 ${\显示样式X=X，}$ 的条件分布 ${\显示样式Y}$ ，由密度给出 $｛\displaystylef_{Y|X=X｝（Y），｝$ 是（重标的）arcsin分布；其累积分布函数为

F_{Y|X=X}（Y）=\mathbb{P}（Y\leqy|X=X）={\frac{1}{2}}+{\frac{1}}{\pi}}\arcsin{\frac-Y}{\sqrt{1-X^{2}{}}}

为所有人 ${\显示样式x}$ 和 ${\显示样式y}$ 这样的话 ${\显示样式x^{2}+y^{2{<1.}$ 相应的期望 ${\显示样式h（x，Y）}$ 只不过是有条件的期望 ${\显示样式E（h（X，Y）|X=X）。}$ 这个混合物所有条件分布 ${\显示样式x}$ （根据 ${\显示样式X}$ )是无条件分配 ${\显示样式Y}$ 这个事实等于相等

{\显示样式{\开始{aligned}&\int_{-\infty}^{+\infty}f_{Y|X=X}（Y）f_{X}（X）}}

后者是全概率定律的实例上述.

什么是条件反射

在离散水平上，只有当条件的概率为非零（不能除以零）时，才可能进行条件处理。在密度水平上，调节 ${\显示样式X=X}$ 即使这样也有可能 ${\显示样式P（X=X）=0.}$ 这种成功可能会造成一种错觉，即条件反射总是可能。遗憾的是，事实并非如此，原因如下。

几何直觉：谨慎

结果 ${\显示样式P（Y\leq 0.75|X=0.5）=5/6，}$ 上面提到的，在以下意义上是几何上明显的。要点 ${\显示样式（x，y，z）}$ 球体的 ${\显示样式x^{2}+y^{2neneneep+z^{2{=1，}$ 满足条件 ${\显示样式x=0.5，}$ 是一个圆 ${\显示样式y^{2}+z^{2{=0.75}$ 半径的 ${\显示样式{\sqrt{0.75}}}$ 在飞机上 ${\显示样式x=0.5.}$ 不平等 ${\显示样式y\leq 0.75}$ 保持在弧上。弧的长度是圆长度的5/6，这就是条件概率等于5/6的原因。

这种成功的几何解释可能会造成以下问题微不足道的错觉。

给定球体的一个点是随机（一致）选择的。假设点位于给定平面上，它的条件分布是什么？

显然，条件分布必须在给定的圆（给定球体和给定平面的交点）上均匀。有时确实如此，但总的来说并非如此。特别是， ${\显示样式Z}$ 均匀分布在 $｛\displaystyle（-1，+1）｝$ 并且与比率无关 $｛\displaystyle Y/X，｝$ 因此， ${\显示样式P（Z\leq 0.5|Y/X）=0.75。}$ 另一方面，不平等 ${\显示样式z\leq 0.5}$ 保持在圆的圆弧上 ${\显示样式x^{2}+y^{2neneneep+z^{2{=1，}$ ${\显示样式y=cx}$ （对于任何给定的 ${\显示样式c}$ ). 弧的长度是圆长度的2/3。然而，条件概率是3/4，而不是2/3。这是经典Borel悖论的表现^[1] ^[2].

“如果不将对称性形式化为不变性论证，那么对对称性的诉求可能会产生误导。”波拉德^[3]

另一个例子。A类随机旋转三维空间的旋转是围绕随机轴以随机角度旋转。几何直觉表明，角度与轴无关，且均匀分布。然而，后者是错误的；角度值较小的可能性较小。

限制程序

给定一个事件 ${\显示样式B}$ 零概率的公式 ${\displaystyle\textstyle\mathbb{P}（A|B）=\ mathbb}P}$ 没用，但是，你可以试试 ${\displaystyle\textstyle\mathbb{P}（A|B）=\lim_{n\to\infty}\mathbb2{P}（A\cap B_{n}）/\mathbb{P}-（B_{n}）}$ 对于适当的事件序列 ${\显示样式B_{n}}$ 非零概率 ${\显示样式B_{n}\向下箭头B}$ （即， ${\displaystyle\textstyle B_{1}\supset B_{2}\supset\dots}$ 和 ${\displaystyle\textstyle B_{1}\cap B_}2\cap\dots=B}$ ). 给出了一个示例在上面。另外两个例子是布朗桥与布朗远足.

在后两个例子中，由于只给出了一个事件（条件），所以总概率定律无关。相反，在这个例子中在上面全概率定律应用，自事件以来 ${\显示样式X=0.5}$ 包含在一系列活动中 ${\显示样式X=X}$ 哪里 ${\显示样式x}$ 跑过 ${\显示样式（-1,1），}$ 这些事件是概率空间的一个分区。

为了避免矛盾（例如博雷尔悖论)，应考虑以下重要区别。如前所述，如果给定事件具有非零概率，则对其进行条件处理是明确定义的（与任何其他事件无关）在上面相反，如果给定事件的概率为零，则除非提供了一些额外的输入，否则对它的条件是不确定的。这种额外输入的错误选择会导致错误的条件概率（期望值、分布）。从这个意义上说，“对于概率等于0的孤立假设，条件概率的概念是不可接受的。" (科尔莫戈罗夫; 引用于^[3]).

附加输入可以是（a）对称（不变性组）；（b）一连串的事件 ${\显示样式B_{n}}$ 这样的话 ${\显示样式B_{n}\向下箭头B，}$ $显示样式P（B_{n}）>0；}$ （c）包含给定事件的分区。测量理论条件作用（下文）调查案例（c），揭示其与（b）的一般关系以及与（a）的关系（如适用）。

一些概率为零的事件超出了条件作用的范围。示例：let ${\显示样式X_{n}}$ 是均匀分布在上的独立随机变量 $｛\displaystyle（0,1），｝$ 和 ${\显示样式B}$ 事件“ ${\显示样式X_{n}\到0}$ 作为 ${\显示样式n\to\infty}$ “；怎么样 $显示样式P（X_{n}<0.5|B）？}$ 它倾向于1吗？另一个例子：let ${\显示样式X}$ 是均匀分布在上的随机变量 $｛\displaystyle（0,1），｝$ 和 ${\显示样式B}$ 事件“ ${\显示样式X}$ 是有理数吗 ${\显示样式P（X=1/n|B）？}$ 唯一的答案是，“关于概率等于0的孤立假设的条件概率的概念是不可接受的。”^[3]).

测量理论层面的条件反射

例子。让 ${\显示样式Y}$ 是均匀分布在上的随机变量 $｛\displaystyle（0,1），｝$ 和 ${\显示样式X=f（Y）}$ 哪里 ${\显示样式f}$ 是给定的函数。以下对两例患者进行治疗： $显示样式f=f{1}}$ 和 $显示样式f=f{2}，}$ 哪里 ${\显示样式f{1}}$ 是连续分段线性函数

{\显示样式f_{1}（y）={\开始{案例}3y&{text{for}0\leqy\leq1/3，\\1.5（1-y）&{text{fro}1/3，\\0.5&{text}for}2/3\leqy \leq1，\end{cases}}

和 ${\显示样式f{2}}$ 无处不在是连续的，但无处不在Weierstrass函数.

几何直觉：谨慎

在这种情况下 $显示样式f=f_{1}，}$ 鉴于 ${\显示样式X=0.75，}$ 的两个值 ${\显示样式Y}$ 可能为0.25和0.5。很明显，这两个值的条件概率都是0.5，因为一个点与另一个点是一致的。然而，这是一种错觉；请参见下文。

条件概率

条件概率 ${\显示样式P（Y\leq 1/3|X）}$ 可以定义为指标的最佳预测值

{\显示样式I={\开始{案例}1&{\text{if}}Y\leq 1/3，\\0&{\text}否则}}，\end{cases}}}

给定X，即使均方误差最小 ${\显示样式E（I-g（X））^{2}}$ 关于形式的所有随机变量类 ${\显示样式g（X）.}$

在这种情况下 $显示样式f=f{1}}$ 相应的函数 ${\显示样式g=g{1}}$ 可以明确计算，^[4]

{\显示样式g{1}（x）={\开始{案例}1&{\text{for}0<x<0.5，\\0&{text{for}x=0.5，\\1/3&{text}for}0.5<x<1.\end{cases}}}

或者，可以使用限制程序，

g_{1}（x）=\lim_{\varepsilon\ to 0+}\mathbb{P}（Y\leq 1/3|x-\varepsilon\leq x\leq x+\varepsi lon）\，，

给出了相同的结果。

因此， $显示样式P（Y\leq 1/3|X）=g_{1}（X）。}$ 该随机变量的期望值等于（无条件）概率， ${\显示样式E（P（Y\leq 1/3|X））=P（Y\ leq 1/3），}$ 即，

{\显示样式1\cdot\mathbb{P}（X<0.5）+0\cdot\mathbb{P}（X=0.5）+{\frac{1}{3}}\cdot\ mathbb}（X>0.5）=1\cdot{1}}{6}}+0\cdot{\frac{1}{3}+{\frac{1{3}{}\cdot \压裂{1}{3}}{\大）}={\压裂{1'{3}{\，，}

它是全概率定律 ${\显示样式E（P（A|X））=P（A）.}$

在这种情况下 $显示样式f=f{2}}$ 相应的函数 ${\显示样式g=g{2}}$ 可能无法明确计算。尽管如此，它仍然存在，并且可以用数值计算。事实上空间 ${\显示样式L_{2}（\Omega）}$ 在所有平方可积随机变量中希尔伯特空间; 指示器 $｛\displaystyle I｝$ 是该空间的向量；和形式的随机变量 ${\显示样式g（X）}$ 是一个（封闭的线性）子空间。这个向量到这个子空间的正交投影是明确定义的。它可以通过使用无限维希尔伯特空间的有限维近似值进行数值计算。

再次，随机变量的期望 $显示样式P（Y\leq 1/3|X）=g_{2}（X）}$ 等于（无条件的）概率， ${\显示样式E（P（Y\leq 1/3|X））=P（Y\ leq 1/3），}$ 即，

{\显示样式\int_{0}^{1} 克_{2} （f{2}（y））\，\mathrm{d}y={frac{1}{3}}\，.}

然而，希尔伯特空间方法处理 ${\显示样式g{2}}$ 作为函数的等价类而不是单个函数。可测量性 ${\显示样式g{2}}$ 确保了，但连续性（甚至黎曼可积性)不是。价值观 $显示样式g{2}（0.5）}$ 是唯一确定的，因为点0.5是 ${\显示样式X}$ .其他值 ${\显示样式x}$ 不是原子，因此对应的值 $显示样式g{2}（x）}$ 不是唯一确定的。再一次，”对于概率等于0的孤立假设，条件概率的概念是不可接受的。“（科尔莫戈罗夫，引自^[3]).

或者，使用相同的功能 ${\显示样式g}$ （顺其自然 ${\显示样式g{1}}$ 或 ${\显示样式g{2}}$ )可以定义为Radon-Nikodym衍生物

g={\frac{\mathrm{d}\nu}{\mathr{d}\mu}}\，，

其中，度量μ、ν定义为

{\显示样式{\开始{对齐}\mu（B）&=\mathbb{P}（X\在B中）

对于所有Borel集合 ${\显示样式B\subset\mathbb{R}.}$ 也就是说，μ是 ${\显示样式X}$ ，而ν是其条件分布的三分之一，

{\displaystyle\nu（B）=\mathbb{P}（X\ in B|Y\leq 1/3）\mathbb2{P}（Y\leq1/3）={\frac{1}{3}}\mathbb{P}-（X\ inB|Y\ leq1/3

两种方法（通过希尔伯特空间和Radon-Nikodym导数）处理 ${\显示样式g}$ 作为函数的等价类；两个功能 ${\显示样式g}$ 和 ${\显示样式g'}$ 被视为等效，如果 ${\显示样式g（X）=g'（X）}$ 几乎可以肯定。因此，条件概率 ${\显示样式P（Y\leq 1/3|X）}$ 被视为随机变量的等价类；像往常一样，如果两个随机变量几乎相等，则将其视为等价的。

有条件的期望

条件期望 ${\显示样式E（Y|X）}$ 可以定义为 ${\显示样式Y}$ 鉴于 ${\显示样式X}$ 也就是说，它最小化了均方误差 ${\显示样式E（Y-h（X））^{2}}$ 关于形式的所有随机变量类 ${\显示样式h（X）.}$

在这种情况下 $显示样式f=f{1}}$ 相应的函数 ${\显示样式h=h{1}}$ 可以明确计算，^[5]

{\显示样式h{1}（x）={\开始{案例}x/3&{\text{for}0<x<0.5，\\5/6&{text{for}x=0.5，\\（2-x）/3&{text}for}0.5<x<1.\end{cases}}

或者，可以使用限制程序，

{\显示样式h_{1}（x）=\lim_{\varepsilon\到0+}\mathbb{E}（Y|x-\varepsilon\leqX\leqx+\varepsi lon）\，，}

给出了相同的结果。

因此， ${\显示样式E（Y|X）=h_{1}（X）.}$ 该随机变量的期望值等于（无条件）期望值， ${\显示样式E（E（Y|X））=E（Y），}$ 即，

{\显示样式{\开始{aligned}&\int_{0}^{1} 小时_{1} （f_｛1｝（y））\，\mathrm｛d｝y=\ int _｛0｝^｛1/6｝｛\frac｛3y｝｛3｝｝\，\mathrm｛d｝y+\\&&quad+\ int _｛1/6｝^｛1/3｝｛2-3y｝｛3｝｝\，\mathrm｛d｝y+\ int _｛1/3｝^｛2/3｝｛2-1.5（1-y）｝｛3｝\，\mathrm｛d｝y+\ int _｛2/3｝^｛1｝\frac｛5｝｛6｝｝\，\mathrm｛d｝y=｛\frac｛1｝｛2｝｝\，\end｛aligned｝｝｝

它是总期望定律 ${\显示样式E（E（Y|X））=E（Y）.}$

在这种情况下 $显示样式f=f{2}}$ 相应的函数 ${\显示样式h=h{2}}$ 可能无法明确计算。尽管如此，它仍然存在，并且可以用与 ${\显示样式g{2}}$ 上面，-作为希尔伯特空间中的正交投影。总期望定律成立，因为投影不能通过属于子空间的常数函数1改变标量积。

或者，使用相同的功能 ${\显示样式h}$ （顺其自然 ${\显示样式h{1}}$ 或 ${\显示样式h{2}}$ )可以定义为Radon-Nikodym衍生物

｛\displaystyle h＝｛\frac｛\mathrm｛d｝\nu｝｛\mathrm｛d｝\mu｝｝\，｝

何处测量 ${\显示样式\mu，\nu}$ 由定义

{\显示样式{\开始{对齐}\mu（B）&=\mathbb{P}（X\在B中）

对于所有Borel集合 ${\显示样式B\subset\mathbb{R}.}$ 在这里 ${\显示样式E（Y；A）}$ 是限制期望，不要与条件期望混淆 ${\显示样式E（Y|A）=E（Y；A）/P（A）。}$

条件分布

在这种情况下 $显示样式f=f{1}}$ 有条件的累积分布函数可以显式计算，类似于 ${\显示样式g{1}.}$ 限制程序给出

{\displaystyle{\begin{aligned}&F_{Y|X=0.75}（Y）=\mathbb{P}（Y\leqy|X=0.75）=\\&=\lim_{\varepsilon\to 0+}\mathbb{P}{案例}0&{\text{for}-\infty<y<1/4，\\1/6&{\text}for}y=1/4，\\1/3&{\text{for}1/4<y<1/2，\\2/3&{text{for}y=2，\\1&{text}for}1/2<y<infty，\end{cases}}\end{aligned}}}}

这不可能是正确的，因为累积分布函数必须右旋的!

这一矛盾的结果由测度理论解释如下。对于给定的 ${\显示样式y}$ 相应的 $显示样式F_{Y|X=X}（Y）=P（Y\leqy|X=X）}$ 定义良好（通过希尔伯特空间或Radon-Nikodym导数）为函数的等价类 ${\显示样式x}$ ). 被视为 ${\显示样式y}$ 对于给定的 ${\显示样式x}$ 除非提供了一些额外的输入，否则它是ill定义的。即函数（of ${\显示样式x}$ )必须在每个（或至少几乎每个）等价类中选择。错误的选择导致错误的条件累积分布函数。

正确的选择如下。第一， $显示样式F_{Y|X=X}（Y）=P（Y\leqy|X=X）}$ 被认为是有理数 ${\显示样式y}$ 只有。（任何其他稠密可数集都可以同样好地使用。）因此，只使用等价类的可数集；这些类中所有函数的选择都是相互等价的，rational的相应函数 ${\显示样式y}$ 定义明确（几乎每个 ${\显示样式x}$ ). 其次，通过右连续性将函数从有理数推广到实数。

一般来说，条件分布是为几乎所有 ${\显示样式x}$ （根据 ${\显示样式X}$ )，但有时结果是连续的 ${\显示样式x}$ ，在这种情况下，可以接受单个值。在所考虑的示例中，情况就是这样；的正确结果 ${\显示样式x=0.75，}$

{\显示样式{\开始{对齐}&F_{Y|X=0.75}（Y）=\mathbb{P}（Y\leqy|X=0.75）=\\&={开始{案例}0&{\text{for}-\infty<y<1/4，\\1/3&{\text}for}1/4 \leqy<1/2，\\1&{text{for}1/2 \leqy<\infty \end{cases}}\end{aligned}}}

显示了 ${\显示样式Y}$ 鉴于 ${\显示样式X=0.75}$ 由两个原子组成，分别为0.25和0.5，概率分别为1/3和2/3。

类似地，条件分布可以计算为 ${\显示样式x}$ 在里面 ${\显示样式（0,0.5）}$ 或 ${\显示样式（0.5,1）.}$

价值观 ${\显示样式x=0.5}$ 是原子的分布 ${\显示样式X}$ 因此，相应的条件分布是明确定义的，可以通过初等方法进行计算（分母不为零）；的条件分布 ${\显示样式Y}$ 鉴于 ${\显示样式X=0.5}$ 是统一的 ${\显示样式（2/3,1）。}$ 测量理论得出了同样的结果。

所有条件分布的混合是 ${\显示样式Y}$ .

条件期望 ${\显示样式E（Y|X=X）}$ 只是关于条件分布的期望。

在这种情况下 $显示样式f=f{2}}$ 相应的 $显示样式F_{Y|X=X}（Y）=P（Y\leqy|X=X）}$ 可能无法明确计算。对于给定的 ${\显示样式y}$ 它（通过希尔伯特空间或Radon-Nikodym导数）被定义为函数的等价类 ${\显示样式x}$ ). 可以如上所述在这些等价类中正确选择函数；它可以得到正确的条件累积分布函数，从而得到条件分布。一般来说，条件分布不需要原子的或绝对连续的（也不是这两种类型的混合物）。可能，在考虑的示例中，它们是单数的（就像康托分布).

再一次，所有条件分布的混合是（无条件）分布，条件期望是关于条件分布的期望。

笔记

↑ 波拉德2002，第节。5.5，第122页示例17
↑ 杜勒特1996，第节。4.1（a），第224页示例1.6
↑³ ^3.1 ^3.2 ^3.3 波拉德2002，第节。5.5，第122页
↑ 证明：
${\显示样式{\开始{对齐}&\mathbb{E}（I-g（X））^{2}=\\&=\int_{0}^{1/3}（1-g（3y））^{1} 克^{2} （0.5）\，\mathrm{d}y=\\&=\int_{0}^{1}（1-g（x））^{2}{\frac{\mathrm{d}x}{3}}+\int_{0.5}^{1} 克^{2} （x）{\frac{\mathrm{d}x}{1.5}}+{\frac{1}{3}g^{2}（0.5）=\\&={\frac:1}{3}}\int_{0}^0.5}（1-g（x））^{2{，\mathrm{d}x+{\frac{1}}{3{g^2}^{1}（（1-g（x））^{2}+2g^{2{（x），；\结束{对齐}}$
需要注意的是 ${\显示样式（1-a）^{2}+2a^{2{}}$ 最小值为 ${\显示样式a=1/3.}$
↑ 证明： ${\显示样式{\开始{对齐}&\mathbb{E}1/3}^{2/3}{\大（}Y-h_{1}（1.5（1-Y））{\大}-h_{1}（x）{\大）}^{2}{\分形{\mathrm{d}x}{3}}+\int_{0.5}^{1}{\大（}1-{\frac{x}{1.5}}-h_{1{（x-{\frac{5}{9}}h{1}（0.5）+{\frac{19}{81}}=\\&{\frac:1}{3}}\int_{0}^{0.5}{\Big）-{\压裂{5}{9}}h{1}（0.5）+{\frac{19}{81}}+\\&\quadra{\frac{1}{3}}\int_{0.5}^{1}}{\bigg（}{\Big（}h_{1}（x）-{\frac:x}{3{}{\大）}^{2}+2{\Bigh（}h_1}（x）-1+{\frac{2x}{2}{3neneneep}{\Big）}}\，\mathrm{d}x\，；\结束{对齐}}$ 需要注意的是 ${\displaystyle\textstyle（a-{\frac{x}{3}}）^{2}+2（a-1+{\frac{2x}{3+}）$ 最小值为 ${\displaystyle\textstyle a={\frac{2-x}{3}}，}$ 和 ${\displaystyle\textstyle{\frac{1}{3}}^{2}-{\压裂{5}{9}}a}$ 最小值为 ${\displaystyle\textstylea={\frac{5}{6}}。}$

工具书类

理查德·杜勒特（1996），概率：理论和示例（第二版）
David Pollard（2002），测量理论概率的用户指南，剑桥大学出版社

[1] 波拉德2002，第节。5.5，第122页示例17

[2] 杜勒特1996，第节。4.1（a），第224页示例1.6

[Pollard-5.5-122-3] ³ ^3.1 ^3.2 ^3.3 波拉德2002，第节。5.5，第122页

[4] 证明：
${\显示样式{\开始{对齐}&\mathbb{E}（I-g（X））^{2}=\\&=\int_{0}^{1/3}（1-g（3y））^{1} 克^{2} （0.5）\，\mathrm{d}y=\\&=\int_{0}^{1}（1-g（x））^{2}{\frac{\mathrm{d}x}{3}}+\int_{0.5}^{1} 克^{2} （x）{\frac{\mathrm{d}x}{1.5}}+{\frac{1}{3}g^{2}（0.5）=\\&={\frac:1}{3}}\int_{0}^0.5}（1-g（x））^{2{，\mathrm{d}x+{\frac{1}}{3{g^2}^{1}（（1-g（x））^{2}+2g^{2{（x），；\结束{对齐}}$
需要注意的是 ${\显示样式（1-a）^{2}+2a^{2{}}$ 最小值为 ${\显示样式a=1/3.}$

[5] 证明： ${\显示样式{\开始{对齐}&\mathbb{E}1/3}^{2/3}{\大（}Y-h_{1}（1.5（1-Y））{\大}-h_{1}（x）{\大）}^{2}{\分形{\mathrm{d}x}{3}}+\int_{0.5}^{1}{\大（}1-{\frac{x}{1.5}}-h_{1{（x-{\frac{5}{9}}h{1}（0.5）+{\frac{19}{81}}=\\&{\frac:1}{3}}\int_{0}^{0.5}{\Big）-{\压裂{5}{9}}h{1}（0.5）+{\frac{19}{81}}+\\&\quadra{\frac{1}{3}}\int_{0.5}^{1}}{\bigg（}{\Big（}h_{1}（x）-{\frac:x}{3{}{\大）}^{2}+2{\Bigh（}h_1}（x）-1+{\frac{2x}{2}{3neneneep}{\Big）}}\，\mathrm{d}x\，；\结束{对齐}}$ 需要注意的是 ${\displaystyle\textstyle（a-{\frac{x}{3}}）^{2}+2（a-1+{\frac{2x}{3+}）$ 最小值为 ${\displaystyle\textstyle a={\frac{2-x}{3}}，}$ 和 ${\displaystyle\textstyle{\frac{1}{3}}^{2}-{\压裂{5}{9}}a}$ 最小值为 ${\displaystyle\textstylea={\frac{5}{6}}。}$

[1]

条件（概率）

目录

离散水平的调节

条件概率

有条件的期望

条件分布

密度水平调节

条件概率

计算

解释

有条件的期望

条件分布

什么是条件反射

几何直觉：谨慎

限制程序

测量理论层面的条件反射

几何直觉：谨慎

条件概率

有条件的期望

条件分布

笔记

工具书类

导航菜单

条件（概率）

离散水平的调节

条件概率

有条件的期望

条件分布

密度水平调节

条件概率

计算

解释

有条件的期望

条件分布

什么是条件反射

几何直觉：谨慎

限制程序

测量理论层面的条件反射

几何直觉：谨慎

条件概率

有条件的期望

条件分布

笔记

工具书类

导航菜单

搜索