2.1. 贝叶斯扰动模型
我们开发了一个贝叶斯模型来表征各种扰动方案z,对(z|θ)和对(θ). 我们在模型中引入扰动对(z,θ) =对(z|θ)对(θ)通过向量ω=ω(z,θ),在一组Ω中变化。那就是,ω是来自示例空间的产品空间的映射𝒵以及参数空间θ到Ω。一般来说,ω包括许多摄动方案,包括加法∊-污染等级如下所述。此外,ω必须仔细选择,以便扰动有意义且合理。
让对(z,θ|ω)是的概率密度(z,θ)对于扰动模型。我们假设对(z,θ|ω)为所有人ω∈Ω有一个共同的支配测度,并且有一个ω0∈Ω,这样对(z,θ|ω0) =对(z,θ)为所有人(z,θ). 我们指的是对(z,θ|ω0) =对(z,θ)作为基线联合分布,其中ω0可以视为Ω的中心点,表示无扰动。我们定义了贝叶斯扰动模型ℳ作为概率密度家族对(z,θ|ω)作为ω单位为Ω。贝叶斯扰动模型包括用于z,对(θ)和对(z|θ)和它们的组合。我们重点关注以下每个方案。
例子1.先验的贝叶斯扰动模型包括许多现有的方案,例如加法∊-污染类和线性和非线性扰动类。例如,添加剂∊-污染方案如下所示对(θ|ω) =对(θ) +λ{克(θ) −对(θ)},其中λ∈[0,1]和克(θ)属于一类污染分布,表示为𝒢(伯杰,1994;Dey和Birmiwal,1994年). 在这种情况下,Ω={ω=λ{克(θ) −对(θ)} : (λ,克(·)) ∈ [0, 1] ×𝒢}和ω(z,θ)与数据无关。因此,ω0=0和对(z,θ|ω) =对(z|θ)对(θ|ω).
例子2.数据的贝叶斯摄动模型包括对单个数据观测的许多摄动方案z(库克,1986年;Guttman&Peña,1993年;佩尼亚和古特曼,1993年;Zhu等人,2007年). 为了识别离群值和影响观测值,提出了数据点扰动方案。作为一个例子,我们考虑标准线性回归模型,其中x个我是一个对×1协变量向量,β是一个对×1回归系数向量和∊我独立且一致分布N个(0,σ2)随机变量。让c(c)我成为我×1矢量,所有元素均等于c(c)对于固定标量c(c)和一个整数我,写为1n个, 1对和0米.扰动协变量的扰动方案x个我由提供x个我(ω我) =x个我+ω我1对在这种情况下,,θ= (βT型,σ2)T型,ω= (ω1, …,ωn个)T型,ω0= 0n个Ω是R(右)n个线性回归模型的另一种扰动方案是众所周知的均值漂移模型(Guttman&Peña,1993年;佩尼亚和古特曼,1993年). 假设对于我在一组k个从集合{1,…,中选择的不同整数,n个},表示为我= {我1, . . . ,我k个}、和对于所有其他我s.在这种情况下,摄动方案为ω= (ω我1, . . . ,ω我k个)T型和ω0= 0k个另一个重要的方案是用于案例删除或案例权重的几何混合模型(Millar&Stewart,2007年;范德林德,2007年). 具体来说,让q个(z我)为任意密度z我独立于θ,然后使用几何混合模型扰动我观测结果如下所示对(z|θ,ω) = {Πj≠i
对(zj个|θ)}对(z我|θ)λ
q个(z我)1−λ/{∫对(z我|θ)λ
q个(z我)1−λ
第纳尔我},其中ω=λ[0,1]和对(z我|θ)是的密度z我在线性模型假设下。在这种情况下,ω0=1表示无扰动。什么时候?λ= 0,对(z我|θ)在中消失对(z|θ,0),相当于删除z我.
例子3.采样分布的贝叶斯扰动模型包括许多扰动方案对(z|θ)比如添加剂∊-污染等级。我们还可以考虑一类扰动采样分布对(z|θ,ω)由定义
哪里C(θ,ω)是归一化常数,ω= (ω1, . . . ,ω米)T型是一个米×1矢量和u个j个(z;θ)是平均值为零的固定标量函数对(z|θ). 在这种情况下,ω0= 0米表示无扰动。数字米在扰动中(1)可以小到1,也可以增加n个(Copas&Eguchi,2005年;Zhu等人,2007年).
2.2. 贝叶斯扰动流形
我们开发了一个新的几何框架,称为贝叶斯扰动流形,用于测量每个扰动ω贝叶斯扰动模型。基于这个流形,我们能够测量扰动量,即扰动模型的每个分量对对(z,θ)以及扰动模型的分量的正交度。这种量化有助于严格评估贝叶斯分析中每个成分的相对影响,并可以揭示数据、先验模型或抽样模型之间的任何差异。
对于无限维集Ω,我们在整篇论文中假设ℳ形成黎曼-希尔伯特流形(弗里德里希,1991年;朗,1995)在某些规律性条件下。对于给定的对(z,θ|ω) ∈ℳ,我们考虑平滑曲线C(t吨) =对{z,θ|ω(t吨)}通过扰动模型的空间ℳ包含0和的开放区间域对{z,θ|ω(0)} =对(z,θ|ω). 请注意ω可能不同于ω0.我们需要C(t吨)足够光滑ℓ̇{z,θ|ω(t吨)} =d日日志对{z,θ|ω(t吨)}/日期称为切线或导数向量ℓ̇{z,θ|ω(t吨)}2
对{z,θ|ω(t吨)}dzdθ<∞适用于所有人t吨在开放区间域中。自对{z,θ|ω(t吨)}是接头密度(z,θ)给定ω(t吨),这是б对{z,θ|ω(t吨)}dzdθ=1,的切线空间ℳ在ω,表示为T型ωℳ,由切线向量形成ℓ̇{z,θ|ω(0)}表示所有可能的平滑曲线C(t吨)这样一来ℓ̇{z,θ|ω(0)}对{z,θ|ω(0)}dzdθ= 0. 我们可以引入任意两个切线向量的内积ν1(ω)和ν2(ω)英寸T型ωℳ作为
什么时候?ω在欧几里德空间中变化,并且与z和θ,内部产品<
ν1,ν2
>(ω)英寸(2)与费希尔信息密切相关。有关详细信息,请参见示例6。因此,平方长度||ν(ω)||2切线向量的ν(ω) ∈T型ωℳ是<ν,ν> (ω) = ∫ν(ω)2
对(z,θ|ω)dzdθ.曲线长度C(t吨)来自t吨1到t吨2是
接下来,我们需要在ℳ考虑一个实函数(f)(ω)定义于ℳ和平滑的曲线对{z,θ|ω(t吨)}英寸ℳ具有对{z,θ|ω(0)} =对(z,θ|ω)和ℓ̇{z,θ|ω(0)} =ν(ω). 我们定义数据流[ν](ω)=极限t吨→0
t吨−1((f)[对{z,θ|ω(t吨)}] −(f)[对{z,θ|ω(0)}])作为的方向导数(f)在扰动分布对(z,θ|ω)在…的方向ν(ω) ∈T型ωℳ。我们考虑两个平滑向量场u个(ω)和v(v)(ω),它们不仅是T型ωℳ,还可以平滑功能ω单位为Ω。我们定义了向量场的方向导数u个(ω)在…的方向v(v)(ω),称为连接,由杜[v(v)](ω)=极限t吨→0
t吨−1[u个{ω(t吨)} −u个{ω(0)}]. 直觉上,如果ω在欧几里德空间中变化,那么杜[v(v)](ω)与的二阶导数密切相关ℓ(z,θ|ω)关于ω我们考虑了Levi–Civita连接,它具有一些良好的几何性质(阿玛里,1990年;朗,1995)并由给出
关于Levi–Civita连接的测地线ℳ是一条平滑的曲线γ(t吨) =对{z,θ|ω(t吨)}上的ℳ具有开放区间域(一,b)和ℓ̇{z,θ|ω(t吨)} =v(v){ω(t吨)}这样,Levi–Civita连接▿v(v)v(v){ω(t吨)} = 0. 直观地说,当一个人沿着同一测地线移动测地线的切线向量时,他可以使它们指向同一方向。此外,测地线可以解释为ℳ.对于固定扰动分布对(z,θ|ω)和给定的方向v(v)(ω) ∈T型ωℳ,有一个独特的测地线γ(t吨) =对{z,θ|ω(t吨)}开区间域覆盖0,因此γ(0) =对(z,θ|ω)和γ̇(0) =v(v)(ω). 最后,根据这些几何量ℳ,我们引入了贝叶斯扰动流形的定义。
D类定义1贝叶斯扰动流形(ℳ, <u个,v(v)>, ▿v(v)
u个)是带有内积<u,v>和Levi–Civita连接的歧管▿v(v)
u个.
当Ω是开集时R(右)米,在某些正则性条件下,贝叶斯扰动流形是米-尺寸歧管(阿玛里,1990年,第16页;Kass&Vos,1997年;Zhu等人,2007年). 现在,我们基于对数据、先验和采样分布的几种扰动来研究贝叶斯扰动流形的一些示例。
例子1,继续的。我们考虑了贝叶斯扰动模型∊-根据以下公式给出的污染等级ℳ= {{(1 −λ)对(θ) +λg(θ)}对(z|θ): λ ∈[0, 1],克(·) ∈𝒢}. 在这种情况下,ω(t吨) =t吨{克(θ) −对(θ)}对于给定的克(·) ∈𝒢,因此我们考虑平滑曲线C克(t吨) =对{z,θ|ω(t吨)} = [对(θ) +t吨{克(θ) −对(θ)}]对(z|θ). 可以看出v(v)克{ω(t吨)} =ℓ̇{z,θ|ω(t吨)} = {克(θ) −对(θ)}/[对(θ) +t吨{克(θ) −对(θ)}]. 对于任何两种密度克1(·)和克2(·)英寸𝒢,我们可以计算切线向量v(v)克我{ω(0)} = {克我(θ) −对(θ)}{对(θ)}−1对于我=1,2及其内积为
它也独立于对(z|θ). 特别是<v(v)克,v(v)克> (ω0) = ∫{克(θ)/对(θ) − 1}2
对(θ)dθ减少到L(左)2中考虑的规范古斯塔夫森(1996).
我们进一步考虑了先验超参数唯一摄动方案的贝叶斯摄动模型ℳ= {对(z,θ|ω) =对(θ|ω)对(z|θ) :ω= (ω1, . . . ,ω米)T型},其中ω独立于两者z和θ.让ω(t吨) = (ω1, . . . ,ωj个−1,ωj个+t吨,ωj个+1, . . . ,ω米)T型,ℓ(θ|ω)=对数对(θ|ω)和ωk个(t吨)成为k个的第个分量ω(t吨). 自ℓ(z,θ|ω)=对数对(θ|ω)+日志对(z|θ),我们有
哪里ω̇k个(t吨) =dΩk个(t吨)/日期和∂ωj个= ∂ / ∂ωj个因此,T型ωℳ被跨越米功能∂ωj个ℓ(θ
|
ω)逐点进入ω.自←对(z|θ)第纳尔=1,中间的内积∂ωj个ℓ(θ
|
ω)和∂ωk个ℓ(θ
|
ω),表示为G公司jk公司(ω),由给出
独立于对(z|θ).
此外,假设对(θ) =对(θ1)对(θ2|θ[1]) . . .对(θ米|θ[米−1])具有层次结构,其中θ[j个]= (θ1, . . . ,θj个)和对(θj个|θ[j个−1])表示条件分布的密度θj个鉴于θ[j个−1]然后,我们扰动对(θ)这样的话对(θ|ω) =对(θ1|ω1)对(θ2|θ[1],ω2) . . .对(θ米|θ[米−1],ω米), ∫对(θ1|ω1)dθ1=1和б对(θj个|θ[j个−1],ωj个)dθj个=1用于j个= 2, . . . ,米在这种情况下,T型ωℳ被跨越米功能∂ω1日志对(θ1|ω1)和∂ωj个日志对(θj个|θ[j个−1],ωj个)的j个= 2, . . . ,米此外,G公司jk公司(ω)全部=0j个≠k个例如,可以显示G公司12(ω) = ∫∂ω1日志对(θ1|ω1)∂ω2日志对(θ2|θ[1],ω2)对(θ|ω)dθ=∂ω1
∂ω2∫对(θ1|ω1)对(θ2|θ1,ω2)dθ2dθ1=∂ω1
∂ω21 = 0. 因此ω彼此正交(Zhu等人,2007年). 此外,它是由(4)那个G公司11(ω) = ∫ {∂ω1日志对(θ1|ω1)}2
对(θ1|ω)dθ1和G公司日本(ω) = ∫ {∂ωj个日志对(θj个|θ[j个−1],ωj个)}2
对(θj个|θ[j个−1],ω)dθj个对于j个⩾ 2.
结合上述结果,我们得出以下命题,其证明可以在补充材料.
P(P)提议1考虑任何贝叶斯扰动模型对ℳ给出的先验= {对(θ|ω)对(z|θ) :ω∈ Ω}.如果ω与z无关,则其贝叶斯扰动流形ℳ的度量张量与采样分布p的规格无关(z|θ).
命题1具有重要含义。独立性确保了现有的局部稳健性结果可以被视为这里开发的新方法的特例(麦卡洛赫,1989年;古斯塔夫森,1996).
例子4.考虑以下给出的贝叶斯扰动模型
在哪儿ω对= (ω1, . . . ,ω米)T型和ω秒= (ω米+1, . . . ,ω米+n个)T型假设独立于两者z和θ.我们认为ω(t吨) = (ω1, . . . ,ωj个−1,ωj个+t吨,ωj个+1, . . . ,ω米+n个)T型具有ω(0) =ω对于每个j个∈ {1, . . . ,米+n个}. 因此,ω̇k个(0) =dΩk个(0)/日期=1用于k个=j个否则为0。出租ℓ(θ|ω对)=对数对(θ|ω对)和ℓ(z|θ,ω秒)=对数对(z|θ,ω秒),我们有
自ω秒和ω对没有共同的组件,T型ωℳ由跨越米+n个功能包括∂ωj个ℓ(θ|ω对)的j个= 1, . . . ,米和∂ωj个ℓ(z|θ,ω秒)的j个=米+ 1, . . . ,米+n个请注意∂ωk个ℓ(θ|ω对)∂ωj个ℓ(z|θ,ω秒)对(z,θ|ω)dzdθ= ∫∂ωk个对(θ|ω对)∂ωj个对(z|θ,ω秒)dzdθ=∂ωk个1∂ωj个1=任何情况下保持0j个,k个因此,它由(5)的内积∂ωj个ℓ(z,θ|ω)和∂ωk个ℓ(z,θ|ω),表示为G公司jk公司(ω),是
此外(6)可以简化为б∂ωj个ℓ(θ|ω对)∂ωk个ℓ(θ|ω对)对(θ|ω对)dθ自¨对(z|θ,ω秒)第纳尔= 1. 对于j个= 1, . . . ,米和k个=米+ 1, . . . ,米+n个,它来自(6)那个<∂ωj个ℓ(z,θ|ω)∂ωk个ℓ(z,θ|ω)>自起=0∂ωk个ℓ(θ|ω对)=0和∂ωj个ℓ(z|θ,ω秒) = 0. 因此,ω秒和ω对在以下方面相互正交< ∂ωj个ℓ(z,θ|ω),∂ωk个ℓ(z,θ|ω)>.
结合上述结果,我们得到以下命题。
P(P)提议2考虑ℳ= {对(z,θ|ω) =对(θ|ω对)对(z|θ,ω秒):}.假设ω对独立于z和бp(θ|ω对)dθ= ∫对(z|θ,ω秒)第纳尔= 1.考虑两条平滑曲线p{z,θ|ω(k个)(t吨)}带ω(k个)(t吨) = {ω(k个),对(t吨),ω(k个),秒(t吨)}T型
这样ω(1)(0) =ω(2)(0) =ω和ω(1),对(t吨)和
ω(2),秒(t吨)与t无关。对于任意两个切线向量vk个(ω) =ℓ̇{z,θ|ω(k个)(0)} ∈T型ωℳ代表k= 1, 2,我们有<v1,v(v)2
>(ω) = 0.
命题2具有重要含义。对于先验分布和采样分布的同时扰动,它确保ω对和ω秒几何上相互正交。因此,我们可以从数据和抽样分布中分离出先验的影响。
最后,我们考虑一个同时扰动模型,表示为对(z,θ|ω对,ωd日,ω秒),其中ω对,ωd日和ω秒分别表示先验、数据和采样分布的个别扰动。除了命题1和命题2之外,我们还可以得到以下定理。
T型神灵1让ℳ= {对(z,θ|ω) =对(θ|ω对)对(z|θ,ωd日,ω秒) :ω= (ω对,ωd日,ω秒)}具有∫对(θ|ω对)dθ= ∫对(z|θ,ωd日,ω秒)第纳尔= 1而ω对
与z无关。考虑两条光滑曲线p{z,θ|ω(k个)(t吨)}带ω(k个)(t吨) = {ω(k个),对(t吨),ω(k个),d日(t吨),ω(k个),秒(t吨)}T型
通过
ω(1)(0) =ω(2)(0) =ω,有两个切向量vk个(ω) =ℓ̇{z,θ|ω(k个)(0)} ∈T型ωℳ,k= 1, 2.然后:
如果ω(1),对(t吨)和{ω(2),d日(t吨),ω(2),秒(t吨)}与t无关,则<v1,v(v)2
>(ω) = 0;
如果{ω(1),对(t吨),ω(1),d日(t吨)}和{ω(2),对(t吨),ω(2),秒(t吨)}与t和p无关(z|θ,ωd日,ω秒) =对1(z|θ,ωd日)对2(z|θ,ω秒)对于任何(ωd日,ω秒),然后<v1,v(v)2
>(ω) = 0.
对于先验、数据和采样分布的同时扰动,定理1(i)确保ω对和(ωd日,ω秒)几何上相互正交。如果对(z|θ,ωd日,ω秒) =对1(z|θ,ωd日)对2(z|θ,ω秒),那么ω对,ωd日、和ω秒几何上相互正交。