信念取决于可用信息。这个想法在概率论通过条件作用.有条件概率,有条件期望和有条件分配分三个级别进行处理:离散概率,概率密度函数、和测量理论.如果条件完全指定,则条件会导致非随机结果;否则,如果条件是随机的,条件作用的结果也是随机的。
这篇文章集中讨论了各种条件作用之间的相互关系,主要通过例子来说明。
离散水平的调节
例子。一枚公平的硬币被掷了10次;这个随机变量
是这10次投掷中的头部数量,以及
-前三次投掷中的头球数。尽管事实上
出现在之前
可能有人知道
但不是
.
条件概率
鉴于此
事件的条件概率
是
一般来说,
![{\displaystyle\mathbb{P}(Y=0|X=X)={\frac{\binom{7}{X}}{\binom{10}{X{}}={\frac{7!(10-X)!}{(7-X)!10!}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/a6e7e8b63ca6a61a564f0982b3af0ff97f3db249)
对于
否则(对于
),
也可以将条件概率视为随机变量,即随机变量的函数
即,
![{\displaystyle\mathbb{P}(Y=0|X)={\begin{cases}{\binom{7}{X}}/{\binom{10}{X{}}&{\text{for}X\leq7,\\0&{text{for}X>7](https://wikimedia.org/api/rest_v1/media/math/render/svg/c5b9109ec92d6c3c37cf14e51247a2d9717a8d5f)
这个期望这个随机变量的概率等于(无条件的)概率,
![{\displaystyle\mathbb{E}(\mathbb}P}(Y=0|X))=\sum_{X}\mathbb{P}](https://wikimedia.org/api/rest_v1/media/math/render/svg/85e579fc3764b275f373a6823850bba6bfd333bc)
即,
![{\displaystyle\sum_{x=0}^{7}{\frac{\binom{7}}{\binom{10}{x}}}\cdot{\frac{1}{2^{10}}{](https://wikimedia.org/api/rest_v1/media/math/render/svg/41d5176b4bd8f38fb64050c4bba3421d3eaabcee)
它是全概率定律
因此,
可以被视为随机变量的值
对应于
另一方面,
定义明确,不考虑其他可能的值
.
有条件的期望
鉴于此
随机变量的条件期望
是
一般来说,
![{\displaystyle\mathbb{E}(Y|X=X)={\frac{3}{10}}X}](https://wikimedia.org/api/rest_v1/media/math/render/svg/690038984793df20a05aecde254ea5287891e16c)
对于
(在本例中,它似乎是一个线性函数,但通常是非线性的。)人们也可以将条件期望视为随机变量,即随机变量的函数
即,
![{\displaystyle\mathbb{E}(Y|X)={\frac{3}{10}}X}](https://wikimedia.org/api/rest_v1/media/math/render/svg/71cff9b7bd83443176815263b7ed748a5861ba95)
这个随机变量的期望值等于
,
![{\displaystyle\mathbb{E}(\mathbb{E}(Y|X))=\sum_{X}\mathbb{E}(Y|X=X)\mathbb{P}(X=X)=\mathbb{E}(Y),}](https://wikimedia.org/api/rest_v1/media/math/render/svg/12edd7f8208802eae358794373c573e8e3eaa694)
即,
或者简单地![{\显示样式\mathbb{E}{\大(}{\frac{3}{10}}X{\Big)}={\frac{3}}{10{}}\mathbb{E}(X)={\frac{3{10}{cdot 5={\frac{3}{2}}\,,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/39cfecbe850bd5eaa80bcf7ec727c82fd8ab77fd)
它是总期望定律
随机变量
是最佳预测
鉴于
也就是说,它最小化了均方误差
关于形式的所有随机变量类
这类随机变量保持不变,如果
被替换为
因此,
这并不意味着
相反,
特别地,
一般来说,
对于每个功能
这是所有可能值的集合上的一对一
。的值
无关;重要的是分区(表示为α
)
![{\displaystyle\Omega=\{X=X_{1}\}\uplus\{X=X_{2}\}\ uplus\dots}](https://wikimedia.org/api/rest_v1/media/math/render/svg/7c979b70fc4c779cf2633de2ba1d1dd52c5cb748)
样本空间的
成不相交集
(此处
所有可能的值都是
.)给定任意分区
属于
,可以定义随机变量
尽管如此,
条件概率可以被视为条件期望的一个特例。也就是说,
如果
是指示器属于
因此,条件概率也取决于分区
由生成
而不是打开
自身;
另一方面,对事件的条件作用
定义明确,前提是
不考虑任何可能包含
作为几个部分之一。
条件分布
鉴于
的条件分布
是
![{\displaystyle\mathbb{P}(Y=Y|X=X)={\frac{{\binom{3}{Y}}{\binom{7}{X-Y}}}{\ binom{10}{X}}}={\frac{{\ binom{X}{Y{}}{](https://wikimedia.org/api/rest_v1/media/math/render/svg/65e540c73e7e8150c6d719fb31a23468472d2992)
对于
它是超几何分布
或同等标准,
相应的期望
由通用公式得出
对于
只不过是有条件的期望
治疗
作为随机分布(四维空间中所有测度的随机向量
人们可以接受它的期望,得到
,-该二项分布
这一事实等于平等
![{\displaystyle\sum_{x=0}^{10}\mathbb{P}(Y=Y|x=x)\mathbb2}(x=x](https://wikimedia.org/api/rest_v1/media/math/render/svg/73eff3609d8a46217462c70b95c903b98e4b17da)
对于
这就是总概率定律。
密度水平调节
例子。球体的一个点
根据球体上的均匀分布随机选择。随机变量
,
,
是随机点的坐标。接头密度
,
,
不存在(因为球体的体积为零),但关节密度
属于
,
存在,
![{\displaystyle f_{X,Y}(X,Y)={\begin{cases}{\frac{1}{2\pi{\sqrt{1-X^{2} -年^{2} }}}}&{\text{if}}x^{2}+y^{2{<1,\\0&{text{otheric}}。\结束{cases}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/072f030c6b9060f89ccb6b5914dcf9a9fae16ec8)
(密度是非恒定的,因为球体和平面之间存在非恒定的角度。)
可以通过积分计算,
![{\displaystyle f_{X}(X)=\int_{-\infty}^{+\infty}f_{X,Y}(X,Y)^{2} -年^{2}}}}}\,;}](https://wikimedia.org/api/rest_v1/media/math/render/svg/f95aede632836bb669bef232f5c7de33dc3bb7b6)
令人惊讶的是,结果并不取决于
in(-1,1),
![{\显示样式f_{X}(X)={\开始{案例}0.5&{\text{for}}-1<x<1,\\0&{\text{otherwise}},\end{cases}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/c459eeb4335384d88ef18e70432a511fae2da9ea)
也就是说
均匀分布在
同样适用于
和
(事实上,为了
无论何时
条件概率
计算
鉴于此
事件的条件概率
是条件密度的积分,
![{\displaystyle{\begin{aligned}&f_{Y|X=0.5}(Y)={\frac{f_{X,Y}(0.5,Y)}{f_}X};\结束{cases}}\\&\mathbb{P}(Y\leq 0.75|X=0.5)=\int_{-\infty}^{0.75}英尺_{Y|X=0.5}(Y)\,\mathrm{d}Y=\\&=\int_{-{\sqrt{0.75}}}^0.75}{\frac{\mathrm{d}Y}{\pi{\sqrt{0.75-Y^{2}}}}={\frac{1}{2}+{\frac:1}{\π}}\arcsin{\sqrt{075}}{6},。\结束{对齐}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/24d1dac2f4504daa16410afc132eb54def977afb)
一般来说,
![{\displaystyle\mathbb{P}(Y\leqy|X=X)={\frac{1}{2}}+{\frac{1}}{\pi}}\arcsin{\frac:Y}{\sqrt{1-X^{2}{}}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/53d9bf0310d877df9acf21d878d6f0ea1ba88183)
为所有人
和
这样的话
(否则为分母
消失)和
(否则条件概率退化为0或1)。也可以将条件概率视为随机变量,即随机变量的函数
即,
![{\displaystyle\mathbb{P}(Y\leqy|X)={\begin{案例}0&{text{for}X^{2}\geq 1-y^{2{text{and}y<0,\\{frac{1}{2}}+{frac}1}{\pi}}\arcsin{\frac{y}{\sqrt{1-X^{2]}}&{text{for}}X^}2}<1-y^},\\1&{text}for}X^{2}}{2}{\text{and}y>0.\结束{cases}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/04d00ed049b5101ab16d23494af22230b99990ec)
该随机变量的期望值等于(无条件)概率,
-
它是全概率定律
解释
条件概率
不能解释为
因为后者给出了0/0。因此,
无法通过经验频率进行解释,因为精确值
没有机会随机出现,甚至在无限序列的独立试验中也不会出现一次。
条件概率可以被解释为极限,
-
有条件的期望
条件期望
没什么意思;它只是通过对称性消失。计算起来更有趣
处理|
|作为的函数
,
:
![{\displaystyle{\begin{aligned}&|Z|=h(X,Y)={\sqrt{1-X^{2} -是^{2}}}\,;\\&\矩阵{E}(|Z||X=0.5)=\int_{-\infty}^{+\infty}h(0.5,y)f_{y|X=0.5}(y)^{2}}}}={\frac{2}{\pi}}{\sqrt{0.75}}\,。\结束{对齐}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/332ab261c75f9cb24d875261e0a89bbc9c61b780)
一般来说,
![{\displaystyle\mathbb{E}(|Z||X=X)={\frac{2}{\pi}}{\sqrt{1-X^{2}}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/8b18ee932a336c026e83749032be18b95aaa8a31)
对于
也可以将条件期望视为随机变量,即随机变量X的函数,
![{\displaystyle\mathbb{E}(|Z||X)={\frac{2}{\pi}}{\sqrt{1-X^{2}}}\,.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/858b402531c8497a0c9a58fd5b188ca4caa74ba0)
这个随机变量的期望值等于
![{\displaystyle\mathbb{E}(\mathbb}(|Z||X)](https://wikimedia.org/api/rest_v1/media/math/render/svg/0247563ab118ce77179f2a1f5d1cca494f644ffd)
即,
![{\displaystyle\int_{-1}^{+1}{\frac{2}{\pi}}{\sqrt{1-x^{2}}}\cdot{\frac{\mathrm{d}x}{2}}={\ frac{1}{2{}\,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/a7e3ebcee4610e86cb8dfbda190f0fac3bed8c25)
它是总期望定律
随机变量
是最佳预测
鉴于
也就是说,它最小化了均方误差
关于形式的所有随机变量类
与离散情况类似,
对于每个可测函数
那是一对一
条件分布
鉴于
的条件分布
,由密度给出
是(重标的)arcsin分布;其累积分布函数为
![{\displaystyle F_{Y|X=X}(Y)=\mathbb{P}(Y\leqy|X=X)={\frac{1}{2}}+{\frac{1}}{\pi}}\arcsin{\frac-Y}{\sqrt{1-X^{2}{}}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/f7726572fe878a4a93b1de609fca083672655b65)
为所有人
和
这样的话
相应的期望
只不过是有条件的期望
这个混合物所有条件分布
(根据
)是无条件分配
这个事实等于相等
![{\显示样式{\开始{aligned}&\int_{-\infty}^{+\infty}f_{Y|X=X}(Y)f_{X}(X)}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/c7c051e7934934e1363d64b587910440fa2ae8f7)
后者是全概率定律的实例上述.
什么是条件反射
在离散水平上,只有当条件的概率为非零(不能除以零)时,才可能进行条件处理。在密度水平上,调节
即使这样也有可能
这种成功可能会造成一种错觉,即条件反射总是可能。遗憾的是,事实并非如此,原因如下。
几何直觉:谨慎
结果
上面提到的,在以下意义上是几何上明显的。要点
球体的
满足条件
是一个圆
半径的
在飞机上
不平等
保持在弧上。弧的长度是圆长度的5/6,这就是条件概率等于5/6的原因。
这种成功的几何解释可能会造成以下问题微不足道的错觉。
- 给定球体的一个点是随机(一致)选择的。假设点位于给定平面上,它的条件分布是什么?
显然,条件分布必须在给定的圆(给定球体和给定平面的交点)上均匀。有时确实如此,但总的来说并非如此。特别是,
均匀分布在
并且与比率无关
因此,
另一方面,不平等
保持在圆的圆弧上
(对于任何给定的
). 弧的长度是圆长度的2/3。然而,条件概率是3/4,而不是2/3。这是经典Borel悖论的表现[1] [2].
“如果不将对称性形式化为不变性论证,那么对对称性的诉求可能会产生误导。”波拉德[3]
另一个例子。A类随机旋转三维空间的旋转是围绕随机轴以随机角度旋转。几何直觉表明,角度与轴无关,且均匀分布。然而,后者是错误的;角度值较小的可能性较小。
限制程序
给定一个事件
零概率的公式
没用,但是,你可以试试
对于适当的事件序列
非零概率
(即,
和
). 给出了一个示例在上面。另外两个例子是布朗桥与布朗远足.
在后两个例子中,由于只给出了一个事件(条件),所以总概率定律无关。相反,在这个例子中在上面全概率定律应用,自事件以来
包含在一系列活动中
哪里
跑过
这些事件是概率空间的一个分区。
为了避免矛盾(例如博雷尔悖论),应考虑以下重要区别。如前所述,如果给定事件具有非零概率,则对其进行条件处理是明确定义的(与任何其他事件无关)在上面相反,如果给定事件的概率为零,则除非提供了一些额外的输入,否则对它的条件是不确定的。这种额外输入的错误选择会导致错误的条件概率(期望值、分布)。从这个意义上说,“对于概率等于0的孤立假设,条件概率的概念是不可接受的。" (科尔莫戈罗夫; 引用于[3]).
附加输入可以是(a)对称(不变性组);(b) 一连串的事件
这样的话
(c) 包含给定事件的分区。测量理论条件作用(下文)调查案例(c),揭示其与(b)的一般关系以及与(a)的关系(如适用)。
一些概率为零的事件超出了条件作用的范围。示例:let
是均匀分布在上的独立随机变量
和
事件“
作为
“;怎么样
它倾向于1吗?另一个例子:let
是均匀分布在上的随机变量
和
事件“
是有理数吗
唯一的答案是,“关于概率等于0的孤立假设的条件概率的概念是不可接受的。”[3]).
测量理论层面的条件反射
例子。让
是均匀分布在上的随机变量
和
哪里
是给定的函数。以下对两例患者进行治疗:
和
哪里
是连续分段线性函数
![{\显示样式f_{1}(y)={\开始{案例}3y&{text{for}0\leqy\leq1/3,\\1.5(1-y)&{text{fro}1/3,\\0.5&{text}for}2/3\leqy \leq1,\end{cases}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/74d4ca89aaa95608eaf5efba7a139e1139230c43)
和
无处不在是连续的,但无处不在Weierstrass函数.
几何直觉:谨慎
在这种情况下
鉴于
的两个值
可能为0.25和0.5。很明显,这两个值的条件概率都是0.5,因为一个点与另一个点是一致的。然而,这是一种错觉;请参见下文。
条件概率
条件概率
可以定义为指标的最佳预测值
![{\显示样式I={\开始{案例}1&{\text{if}}Y\leq 1/3,\\0&{\text}否则}},\end{cases}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/bdbed3165113dcf496ec417f92425cafaf97ec6e)
给定X,即使均方误差最小
关于形式的所有随机变量类
在这种情况下
相应的函数
可以明确计算,[4]
![{\显示样式g{1}(x)={\开始{案例}1&{\text{for}0<x<0.5,\\0&{text{for}x=0.5,\\1/3&{text}for}0.5<x<1.\end{cases}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/ceae66c9f9fa369a9817d31c753e871ea4daf665)
或者,可以使用限制程序,
![{\displaystyle g_{1}(x)=\lim_{\varepsilon\ to 0+}\mathbb{P}(Y\leq 1/3|x-\varepsilon\leq x\leq x+\varepsi lon)\,,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/4bfdcc1191fa3df15a3ebf2d1d84975c91973085)
给出了相同的结果。
因此,
该随机变量的期望值等于(无条件)概率,
即,
![{\显示样式1\cdot\mathbb{P}(X<0.5)+0\cdot\mathbb{P}(X=0.5)+{\frac{1}{3}}\cdot\ mathbb}(X>0.5)=1\cdot{1}}{6}}+0\cdot{\frac{1}{3}+{\frac{1{3}{}\cdot \压裂{1}{3}}{\大)}={\压裂{1'{3}{\,,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/9f5c2cf0b41af8b7df4b5c0f5a94c830447d0b6a)
它是全概率定律
在这种情况下
相应的函数
可能无法明确计算。尽管如此,它仍然存在,并且可以用数值计算。事实上空间
在所有平方可积随机变量中希尔伯特空间; 指示器
是该空间的向量;和形式的随机变量
是一个(封闭的线性)子空间。这个向量到这个子空间的正交投影是明确定义的。它可以通过使用无限维希尔伯特空间的有限维近似值进行数值计算。
再次,随机变量的期望
等于(无条件的)概率,
即,
![{\显示样式\int_{0}^{1} 克_{2} (f{2}(y))\,\mathrm{d}y={frac{1}{3}}\,.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/0ed5c3635fce552fceef9501ccd3cc746ab52044)
然而,希尔伯特空间方法处理
作为函数的等价类而不是单个函数。可测量性
确保了,但连续性(甚至黎曼可积性)不是。价值观
是唯一确定的,因为点0.5是
.其他值
不是原子,因此对应的值
不是唯一确定的。再一次,”对于概率等于0的孤立假设,条件概率的概念是不可接受的。“(科尔莫戈罗夫,引自[3]).
或者,使用相同的功能
(顺其自然
或
)可以定义为Radon-Nikodym衍生物
![{\displaystyle g={\frac{\mathrm{d}\nu}{\mathr{d}\mu}}\,,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/81f1874866263b1f4d7dc28f00303686e0b62e4e)
其中,度量μ、ν定义为
![{\显示样式{\开始{对齐}\mu(B)&=\mathbb{P}(X\在B中)](https://wikimedia.org/api/rest_v1/media/math/render/svg/9123c4b753d7b870c1fbe3521d0be62901f691ba)
对于所有Borel集合
也就是说,μ是
,而ν是其条件分布的三分之一,
![{\displaystyle\nu(B)=\mathbb{P}(X\ in B|Y\leq 1/3)\mathbb2{P}(Y\leq1/3)={\frac{1}{3}}\mathbb{P}-(X\ inB|Y\ leq1/3](https://wikimedia.org/api/rest_v1/media/math/render/svg/d52abc46ceacde046b4cb48b867acc122863fdfb)
两种方法(通过希尔伯特空间和Radon-Nikodym导数)处理
作为函数的等价类;两个功能
和
被视为等效,如果
几乎可以肯定。因此,条件概率
被视为随机变量的等价类;像往常一样,如果两个随机变量几乎相等,则将其视为等价的。
有条件的期望
条件期望
可以定义为
鉴于
也就是说,它最小化了均方误差
关于形式的所有随机变量类
在这种情况下
相应的函数
可以明确计算,[5]
![{\显示样式h{1}(x)={\开始{案例}x/3&{\text{for}0<x<0.5,\\5/6&{text{for}x=0.5,\\(2-x)/3&{text}for}0.5<x<1.\end{cases}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/298a1c3a0794112acaae4fcbc29fa0912452d8c8)
或者,可以使用限制程序,
![{\显示样式h_{1}(x)=\lim_{\varepsilon\到0+}\mathbb{E}(Y|x-\varepsilon\leqX\leqx+\varepsi lon)\,,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/c18d58d8444aa481e9671f4cac97635000963fb8)
给出了相同的结果。
因此,
该随机变量的期望值等于(无条件)期望值,
即,
![{\显示样式{\开始{aligned}&\int_{0}^{1} 小时_{1} (f_{1}(y))\,\mathrm{d}y=\ int _{0}^{1/6}{\frac{3y}{3}}\,\mathrm{d}y+\\&&quad+\ int _{1/6}^{1/3}{2-3y}{3}}\,\mathrm{d}y+\ int _{1/3}^{2/3}{2-1.5(1-y)}{3}\,\mathrm{d}y+\ int _{2/3}^{1}\frac{5}{6}}\,\mathrm{d}y={\frac{1}{2}}\,\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/038c5a6f30f51f0d94b50632559515b8a5a608d9)
它是总期望定律
在这种情况下
相应的函数
可能无法明确计算。尽管如此,它仍然存在,并且可以用与
上面,-作为希尔伯特空间中的正交投影。总期望定律成立,因为投影不能通过属于子空间的常数函数1改变标量积。
或者,使用相同的功能
(顺其自然
或
)可以定义为Radon-Nikodym衍生物
![{\displaystyle h={\frac{\mathrm{d}\nu}{\mathrm{d}\mu}}\,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/2ac7a51d26b57089ef43423ffbe3a20efb9569f7)
何处测量
由定义
![{\显示样式{\开始{对齐}\mu(B)&=\mathbb{P}(X\在B中)](https://wikimedia.org/api/rest_v1/media/math/render/svg/826480b1c4aea14f2ddf09add752594ecbf25514)
对于所有Borel集合
在这里
是限制期望,不要与条件期望混淆
条件分布
在这种情况下
有条件的累积分布函数可以显式计算,类似于
限制程序给出
![{\displaystyle{\begin{aligned}&F_{Y|X=0.75}(Y)=\mathbb{P}(Y\leqy|X=0.75)=\\&=\lim_{\varepsilon\to 0+}\mathbb{P}{案例}0&{\text{for}-\infty<y<1/4,\\1/6&{\text}for}y=1/4,\\1/3&{\text{for}1/4<y<1/2,\\2/3&{text{for}y=2,\\1&{text}for}1/2<y<infty,\end{cases}}\end{aligned}}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/37a3339c51ad533dc2b328ce5e04e4283079ee3e)
这不可能是正确的,因为累积分布函数必须右旋的!
这一矛盾的结果由测度理论解释如下。对于给定的
相应的
定义良好(通过希尔伯特空间或Radon-Nikodym导数)为函数的等价类
). 被视为
对于给定的
除非提供了一些额外的输入,否则它是ill定义的。即函数(of
)必须在每个(或至少几乎每个)等价类中选择。错误的选择导致错误的条件累积分布函数。
正确的选择如下。第一,
被认为是有理数
只有。(任何其他稠密可数集都可以同样好地使用。)因此,只使用等价类的可数集;这些类中所有函数的选择都是相互等价的,rational的相应函数
定义明确(几乎每个
). 其次,通过右连续性将函数从有理数推广到实数。
一般来说,条件分布是为几乎所有
(根据
),但有时结果是连续的
,在这种情况下,可以接受单个值。在所考虑的示例中,情况就是这样;的正确结果
![{\显示样式{\开始{对齐}&F_{Y|X=0.75}(Y)=\mathbb{P}(Y\leqy|X=0.75)=\\&={开始{案例}0&{\text{for}-\infty<y<1/4,\\1/3&{\text}for}1/4 \leqy<1/2,\\1&{text{for}1/2 \leqy<\infty \end{cases}}\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/d473edf81265ac8f7dacfeabcd013cc555bcacbd)
显示了
鉴于
由两个原子组成,分别为0.25和0.5,概率分别为1/3和2/3。
类似地,条件分布可以计算为
在里面
或
价值观
是原子的分布
因此,相应的条件分布是明确定义的,可以通过初等方法进行计算(分母不为零);的条件分布
鉴于
是统一的
测量理论得出了同样的结果。
所有条件分布的混合是
.
条件期望
只是关于条件分布的期望。
在这种情况下
相应的
可能无法明确计算。对于给定的
它(通过希尔伯特空间或Radon-Nikodym导数)被定义为函数的等价类
). 可以如上所述在这些等价类中正确选择函数;它可以得到正确的条件累积分布函数,从而得到条件分布。一般来说,条件分布不需要原子的或绝对连续的(也不是这两种类型的混合物)。可能,在考虑的示例中,它们是单数的(就像康托分布).
再一次,所有条件分布的混合是(无条件)分布,条件期望是关于条件分布的期望。
笔记
- ↑ 波拉德2002,第节。5.5,第122页示例17
- ↑ 杜勒特1996,第节。4.1(a),第224页示例1.6
- ↑3 3.1 3.2 3.3 波拉德2002,第节。5.5,第122页
- ↑ 证明:
![{\显示样式{\开始{对齐}&\mathbb{E}(I-g(X))^{2}=\\&=\int_{0}^{1/3}(1-g(3y))^{1} 克^{2} (0.5)\,\mathrm{d}y=\\&=\int_{0}^{1}(1-g(x))^{2}{\frac{\mathrm{d}x}{3}}+\int_{0.5}^{1} 克^{2} (x){\frac{\mathrm{d}x}{1.5}}+{\frac{1}{3}g^{2}(0.5)=\\&={\frac:1}{3}}\int_{0}^0.5}(1-g(x))^{2{,\mathrm{d}x+{\frac{1}}{3{g^2}^{1}((1-g(x))^{2}+2g^{2{(x),;\结束{对齐}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/aeeec78a17b7ec00902d9e615796755ddc8c0efd)
需要注意的是
最小值为
- ↑ 证明:
需要注意的是
最小值为
和
最小值为
工具书类
- 理查德·杜勒特(1996),概率:理论和示例(第二版)
- David Pollard(2002),测量理论概率的用户指南,剑桥大学出版社