Bayesian influence analysis: a geometric approach

HONGTU ZHU; JOSEPH G. IBRAHIM; NIANSHENG TANG

doi:10.1093/biomet/asr009

生物特征。2011年6月；98(2): 307–323.

数字对象标识：10.1093/biomet/asr009

预防性维修识别码：项目经理3897258

NIHMSID公司：美国国家卫生研究院265394

PMID：24453379

贝叶斯影响分析：一种几何方法

朱洪图和约瑟夫·伊布拉希姆

美国北卡罗来纳州教堂山北卡罗莱纳大学生物统计系，CB#7420，邮编：27516。，ude.cnu.soib@uhzh,ude.cnu.soib@miharbi

宁生堂

云南大学统计系，昆明650091，ude.cnu.oib@gnatsn

文章注释版权和许可信息 PMC免责声明

关联数据

补充材料: 补充材料可在生物特征在线课程包括命题1的证明、缺失数据问题的真实数据分析和广泛的模拟。
asr009支持.pdf（100万）
GUID:9C06EF09-1B8B-4A94-A28A-FAEE8213BF7B

总结

本文提出了贝叶斯影响分析的一般框架，用于评估一类统计模型的数据、先验和抽样分布的各种扰动方案。我们引入了一个摄动模型来表征这些不同的摄动方案。我们开发了一个几何框架，称为贝叶斯扰动流形，并使用其相关的几何量，包括度量张量和测地线来表征扰动模型的内在结构。我们基于贝叶斯扰动流形开发了内在影响测度和局部影响测度，以量化各种扰动对统计模型的影响。通过理论和数值示例，突出了这种局部影响方法在正式贝叶斯分析中的广泛应用。

关键词：影响度量，扰动流形，扰动模型，先验分布

1.简介

数据的形式化贝叶斯分析z= (z₁, . . . ,z_n个)涉及抽样分布的规范对(z|θ)和先验分布对(θ)，其中θ= (θ₁, . . . ,θ_k个)^T型表示推理兴趣的参数，并在开集θ中变化R（右）^k个为了进行贝叶斯推断，我们通常使用马尔可夫链蒙特卡罗方法来模拟来自后验分布的样本对(θ|z)，与对(z|θ)对(θ). 随后，我们可以计算θ在里面R（右）^k个，例如后验平均值M（M）(小时) = ∫小时(θ)对(θ|z)dθ函数的小时(θ). 为了简单起见，我们在整篇文章中没有明确强调主要度量。人们对后验推理的敏感程度很感兴趣对(θ),对(z|θ)和(z₁, . . . ,z_n个) (Kass等人，1989年;麦卡洛赫，1989年;伯杰，1990年,1994;Dey等人，1996年;古斯塔夫森，2000;Sivaganesan，2000年;Oakley&O'Hagan，2004年).

有三种主要的形式影响技术，包括案例影响度量和全局和局部稳健性方法，用于量化后验分布对贝叶斯分析的这三个关键要素（包括先验、抽样分布和数据）的依赖程度(伯杰，1990年,1994). 在贝叶斯分析中，案例影响度量主要计算一组观测值的影响，以识别异常值和有影响的观测值。大多数案例影响测量基于案例删除或扰动的后验和/或预测分布(Guttman&Peña，1993年;佩尼亚和古特曼，1993年;Carlin&Polson，1991年;Peng&Dey，1995年). 例如，已经开发了几种案例影响诊断方法，以量化基于均值漂移或方差漂移模型的一组观测值的可能异常(Guttman&Peña，1993年;佩尼亚和古特曼，1993年).

全局稳健性方法的关键思想是，当三个关键元素中的每一个的扰动在某一组分布中发生变化时，计算一系列后验量，然后确定极值。这种方法有一些缺点，包括后验量的尺度选择、扰动的大小及其对线性泛函的限制以及模型的简单性。为了解决尺度问题，已经为先前的扰动类提出了几个尺度范围的版本(Ruggeri&Sivaganesan，2000年).

局部鲁棒性方法主要计算后验量相对于小扰动的导数对(θ)和对(z|θ). 在常客文学中，库克（1986）影响方法对扰动特别有用对(z|θ)为了检测有影响的观测值并评估参数和半参数模型中的模型指定错误(朱和李，2001;Zhu等人，2007年).McCulloch（1989）进一步扩展了局部影响方法库克（1986）以评估在贝叶斯分析中扰动先验的影响。在贝叶斯文献中，已经使用影响度量的曲率开发了几个局部影响的类似物(拉文，1992年;Dey&Birmiwal，1994年;Millar&Stewart，2007年;范德林德，2007)或后验函数相对于前验函数的Fréchet导数(伯杰，1994;古斯塔夫森和瓦瑟曼，1995年;Dey等人，1996年;古斯塔夫森，1996;Berger等人，2000年). 对于开发用于同时扰动的通用贝叶斯影响分析方法，我们做得很少z,对(θ)和对(z|θ)评估其影响并检查其在统计模型中的应用(Berger等人，2000年). 据我们所知，克拉克和古斯塔夫森（1998）是少数几篇关于同时扰动的论文之一{z,对(θ),对(z|θ)}在独立和相同分布数据的上下文中。

该方法的一个关键动机是统一许多复杂贝叶斯模型的影响概念，对于这些模型，几乎没有或只有很少的方法，因此可以识别不同扰动的影响。这些模型包括许多贝叶斯参数和半参数模型，可能缺少数据；请参阅补充材料我们的开发包括对异常值和影响点的正式评估，以及关于贝叶斯模型三个主要组成部分的敏感性分析：先验、抽样分布和数据。例如，通过随机噪声扰动所有数据点，重新进行分析，并获得噪声定义的不同推断谱，可以评估对数据的敏感性(Wang等人，2009年;克拉克，2010年).

2.贝叶斯扰动模型和流形

2.1. 贝叶斯扰动模型

我们开发了一个贝叶斯模型来表征各种扰动方案z,对(z|θ)和对(θ). 我们在模型中引入扰动对(z,θ) =对(z|θ)对(θ)通过向量ω=ω(z,θ)，在一组Ω中变化。那就是，ω是来自示例空间的产品空间的映射𝒵以及参数空间θ到Ω。一般来说，ω包括许多摄动方案，包括加法∊-污染等级如下所述。此外，ω必须仔细选择，以便扰动有意义且合理。

例子1.先验的贝叶斯扰动模型包括许多现有的方案，例如加法∊-污染类和线性和非线性扰动类。例如，添加剂∊-污染方案如下所示对(θ|ω) =对(θ) +λ{克(θ) −对(θ)}，其中λ∈[0,1]和克(θ)属于一类污染分布，表示为𝒢(伯杰，1994;Dey和Birmiwal，1994年). 在这种情况下，Ω={ω=λ{克(θ) −对(θ)} : (λ,克(·)) ∈ [0, 1] ×𝒢}和ω(z,θ)与数据无关。因此，ω⁰=0和对(z,θ|ω) =对(z|θ)对(θ|ω).

例子2.数据的贝叶斯摄动模型包括对单个数据观测的许多摄动方案z(库克，1986年;Guttman&Peña，1993年;佩尼亚和古特曼，1993年;Zhu等人，2007年). 为了识别离群值和影响观测值，提出了数据点扰动方案。作为一个例子，我们考虑标准线性回归模型 $年_{我} = {x个}_{我}^{T型} β + ∊_{我}$ ，其中x个_我是一个对×1协变量向量，β是一个对×1回归系数向量和∊_我独立且一致分布N个(0,σ²)随机变量。让c（c）_我成为我×1矢量，所有元素均等于c（c）对于固定标量c（c）和一个整数我，写为1_n个, 1_对和0_米.扰动协变量的扰动方案x个_我由提供x个_我(ω_我) =x个_我+ω_我1_对在这种情况下， $z_{我} = {(年_{我}, {x个}_{我}^{T型})}^{T型}$ ,θ= (β^T型,σ²)^T型,ω= (ω₁, …,ω_n个)^T型,ω⁰= 0_n个Ω是R（右）^n个线性回归模型的另一种扰动方案是众所周知的均值漂移模型(Guttman&Peña，1993年;佩尼亚和古特曼，1993年). 假设 $年_{我} = {x个}_{我}^{T型} β + ω_{我} + ∊_{我}$ 对于我在一组k个从集合{1，…，中选择的不同整数，n个}，表示为我= {我₁, . . . ,我_k个}、和 $年_{我} = {x个}_{我}^{T型} β + ∊_{我}$ 对于所有其他我s.在这种情况下，摄动方案为ω= (ω_我₁, . . . ,ω_{我_k个})^T型和ω⁰= 0_k个另一个重要的方案是用于案例删除或案例权重的几何混合模型(Millar&Stewart，2007年;范德林德，2007年). 具体来说，让q个(z_我)为任意密度z_我独立于θ，然后使用几何混合模型扰动我观测结果如下所示对(z|θ,ω) = {Π_j≠i 对(z_j个|θ)}对(z_我|θ)^λ q个(z_我)¹⁻^λ/{∫对(z_我|θ)^λ q个(z_我)¹⁻^λ 第纳尔_我}，其中ω=λ[0，1]和对(z_我|θ)是的密度z_我在线性模型假设下。在这种情况下，ω⁰=1表示无扰动。什么时候？λ= 0,对(z_我|θ)在中消失对(z|θ，0），相当于删除z_我.

例子3.采样分布的贝叶斯扰动模型包括许多扰动方案对(z|θ)比如添加剂∊-污染等级。我们还可以考虑一类扰动采样分布对(z|θ,ω)由定义

对 (z | θ, ω) = 对 (z | θ) 经验 {\sum_{j个 = 1}^{米} ω_{j个} {u个}_{j个} (z; θ) - 0.5 \sum_{j个 = 1}^{米} ω_{j个}^{2} {u个}_{j个} {(z; θ)}^{2} - C (θ, ω)},

(1)

哪里C(θ,ω)是归一化常数，ω= (ω₁, . . . ,ω_米)^T型是一个米×1矢量和u个_j个(z;θ)是平均值为零的固定标量函数对(z|θ). 在这种情况下，ω⁰= 0_米表示无扰动。数字米在扰动中(1)可以小到1，也可以增加n个(Copas&Eguchi，2005年;Zhu等人，2007年).

2.2. 贝叶斯扰动流形

我们开发了一个新的几何框架，称为贝叶斯扰动流形，用于测量每个扰动ω贝叶斯扰动模型。基于这个流形，我们能够测量扰动量，即扰动模型的每个分量对对(z,θ)以及扰动模型的分量的正交度。这种量化有助于严格评估贝叶斯分析中每个成分的相对影响，并可以揭示数据、先验模型或抽样模型之间的任何差异。

对于无限维集Ω，我们在整篇论文中假设ℳ形成黎曼-希尔伯特流形(弗里德里希，1991年;朗，1995)在某些规律性条件下。对于给定的对(z,θ|ω) ∈ℳ，我们考虑平滑曲线C(t吨) =对{z,θ|ω(t吨)}通过扰动模型的空间ℳ包含0和的开放区间域对{z,θ|ω(0)} =对(z,θ|ω). 请注意ω可能不同于ω⁰.我们需要C(t吨)足够光滑ℓ̇{z,θ|ω(t吨)} =d日日志对{z,θ|ω(t吨)}/日期称为切线或导数向量ℓ̇{z,θ|ω(t吨)}² 对{z,θ|ω(t吨)}dzdθ<∞适用于所有人t吨在开放区间域中。自对{z,θ|ω(t吨)}是接头密度(z,θ)给定ω(t吨)，这是б对{z,θ|ω(t吨)}dzdθ=1，的切线空间ℳ在ω，表示为T型_ωℳ，由切线向量形成ℓ̇{z,θ|ω（0）}表示所有可能的平滑曲线C(t吨)这样一来ℓ̇{z,θ|ω(0)}对{z,θ|ω(0)}dzdθ= 0. 我们可以引入任意两个切线向量的内积ν₁(ω)和ν₂(ω)英寸T型_ωℳ作为

< v（v）₁, v（v）₂ > (ω) = ∫{v（v）₁(ω)v（v）₂(ω)}对(z, θ|ω)d日zd日θ.

(2)

什么时候？ω在欧几里德空间中变化，并且与z和θ，内部产品< ν₁,ν₂ >(ω)英寸(2)与费希尔信息密切相关。有关详细信息，请参见示例6。因此，平方长度||ν(ω)||²切线向量的ν(ω) ∈T型_ωℳ是<ν,ν> (ω) = ∫ν(ω)² 对(z,θ|ω)dzdθ.曲线长度C(t吨)来自t吨₁到t吨₂是

{S公司}_{C} {ω ({t吨}_{1}), ω ({t吨}_{2})} = \int_{{t吨}_{1}}^{{t吨}_{2}} {[< \dot{ℓ} {z, θ | ω (t吨)}, \dot{ℓ} {z, θ | ω (t吨)} > {ω (t吨)}]}^{1 / 2} d日 t吨 .

(3)

接下来，我们需要在ℳ考虑一个实函数（f）(ω)定义于ℳ和平滑的曲线对{z,θ|ω(t吨)}英寸ℳ具有对{z,θ|ω(0)} =对(z,θ|ω)和ℓ̇{z,θ|ω(0)} =ν(ω). 我们定义数据流[ν](ω)=极限_t吨→0 t吨⁻¹(（f）[对{z,θ|ω(t吨)}] −（f）[对{z,θ|ω（0）}]）作为的方向导数（f）在扰动分布对(z,θ|ω)在…的方向ν(ω) ∈T型_ωℳ。我们考虑两个平滑向量场u个(ω)和v（v）(ω)，它们不仅是T型_ωℳ，还可以平滑功能ω单位为Ω。我们定义了向量场的方向导数u个(ω)在…的方向v（v）(ω)，称为连接，由杜[v（v）](ω)=极限_t吨→0 t吨⁻¹[u个{ω(t吨)} −u个{ω(0)}]. 直觉上，如果ω在欧几里德空间中变化，那么杜[v（v）](ω)与的二阶导数密切相关ℓ(z,θ|ω)关于ω我们考虑了Levi–Civita连接，它具有一些良好的几何性质(阿玛里，1990年;朗，1995)并由给出

∇_v（v）u个(ω) = d日u个[v（v）](ω)−0.5{u个(ω)v（v）(ω)对(z, θ|ω)−∫u个(ω)v（v）(ω)对(z, θ|ω)d日zd日θ}.

关于Levi–Civita连接的测地线ℳ是一条平滑的曲线γ(t吨) =对{z,θ|ω(t吨)}上的ℳ具有开放区间域(一,b)和ℓ̇{z,θ|ω(t吨)} =v（v）{ω(t吨)}这样，Levi–Civita连接▿_v（v）v（v）{ω(t吨)} = 0. 直观地说，当一个人沿着同一测地线移动测地线的切线向量时，他可以使它们指向同一方向。此外，测地线可以解释为ℳ.对于固定扰动分布对(z,θ|ω)和给定的方向v（v）(ω) ∈T型_ωℳ，有一个独特的测地线γ(t吨) =对{z,θ|ω(t吨)}开区间域覆盖0，因此γ(0) =对(z,θ|ω)和γ̇(0) =v（v）(ω). 最后，根据这些几何量ℳ，我们引入了贝叶斯扰动流形的定义。

D类定义1贝叶斯扰动流形(ℳ, <u个,v（v）>, ▿_v（v） u个)是带有内积<u，v>和Levi–Civita连接的歧管▿_v（v） u个.

当Ω是开集时R（右）^米，在某些正则性条件下，贝叶斯扰动流形是米-尺寸歧管(阿玛里，1990年，第16页；Kass&Vos，1997年;Zhu等人，2007年). 现在，我们基于对数据、先验和采样分布的几种扰动来研究贝叶斯扰动流形的一些示例。

例子1,继续的。我们考虑了贝叶斯扰动模型∊-根据以下公式给出的污染等级ℳ= {{(1 −λ)对(θ) +λg(θ)}对(z|θ): λ ∈[0, 1],克(·) ∈𝒢}. 在这种情况下，ω(t吨) =t吨{克(θ) −对(θ)}对于给定的克(·) ∈𝒢，因此我们考虑平滑曲线C_克(t吨) =对{z,θ|ω(t吨)} = [对(θ) +t吨{克(θ) −对(θ)}]对(z|θ). 可以看出v（v）_克{ω(t吨)} =ℓ̇{z,θ|ω(t吨)} = {克(θ) −对(θ)}/[对(θ) +t吨{克(θ) −对(θ)}]. 对于任何两种密度克₁（·）和克₂（·）英寸𝒢，我们可以计算切线向量v（v）_{克_我}{ω(0)} = {克_我(θ) −对(θ)}{对(θ)}⁻¹对于我=1,2及其内积为

< v（v）_克₁, v（v）_克₂ > (ω⁰) = ∫[克₁(θ){对(θ)}⁻¹ − 1][克₂(θ){对(θ)}⁻¹ − 1]对(θ)d日θ,

它也独立于对(z|θ). 特别是<v（v）_克,v（v）_克> (ω⁰) = ∫{克(θ)/对(θ) − 1}² 对(θ)dθ减少到L（左）²中考虑的规范古斯塔夫森（1996）.

我们进一步考虑了先验超参数唯一摄动方案的贝叶斯摄动模型ℳ= {对(z,θ|ω) =对(θ|ω)对(z|θ) :ω= (ω₁, . . . ,ω_米)^T型}，其中ω独立于两者z和θ.让ω(t吨) = (ω₁, . . . ,ω_j个−1,ω_j个+t吨,ω_j个₊₁, . . . ,ω_米)^T型,ℓ(θ|ω)=对数对(θ|ω)和ω_k个(t吨)成为k个的第个分量ω(t吨). 自ℓ(z,θ|ω)=对数对(θ|ω)+日志对(z|θ)，我们有

\dot{ℓ} {z, θ | ω (0)} = d日 ℓ {z, θ | ω (t吨)} / d日 t吨 |_{t吨 = 0} = \sum_{k个 = 1}^{米} [{\dot{ω}}_{k个} (t吨) \partial_{ω_{k个}} ℓ {θ | ω (t吨)}] |_{t吨 = 0} = \partial_{ω_{j个}} ℓ (θ | ω),

哪里ω̇_k个(t吨) =dΩ_k个(t吨)/日期和∂_{ω_j个}= ∂ / ∂ω_j个因此，T型_ωℳ被跨越米功能∂_{ω_j个}ℓ(θ | ω)逐点进入ω.自←对(z|θ)第纳尔=1，中间的内积∂_{ω_j个}ℓ(θ | ω)和∂_{ω_k个}ℓ(θ | ω)，表示为G公司_jk公司(ω)，由给出

\begin{array}{l} {G公司}_{j个 k个} (ω) & = \int \partial_{ω_{j个}} ℓ (θ | ω) \partial_{ω_{k个}} ℓ (θ | ω) 对 (θ | ω) 对 (z | θ) d日 z d日 θ \\ = \int \partial_{ω_{j个}} ℓ (θ | ω) \partial_{ω_{k个}} ℓ (θ | ω) 对 (θ | ω) d日 θ, \end{array}

(4)

独立于对(z|θ).

此外，假设对(θ) =对(θ₁)对(θ₂|θ_[1]) . . .对(θ_米|θ_[米−1])具有层次结构，其中θ_[j个]= (θ₁, . . . ,θ_j个₎和对(θ_j个|θ_[_j个−1])表示条件分布的密度θ_j个鉴于θ_[j个−1]然后，我们扰动对(θ)这样的话对(θ|ω) =对(θ₁|ω₁)对(θ₂|θ_[1],ω₂) . . .对(θ_米|θ_[米−1],ω_米), ∫对(θ₁|ω₁)dθ₁=1和б对(θ_j个|θ_[j个−1],ω_j个)dθ_j个=1用于j个= 2, . . . ,米在这种情况下，T型_ωℳ被跨越米功能∂_ω₁日志对(θ₁|ω₁)和∂_{ω_j个}日志对(θ_j个|θ_[j个−1],ω_j个)的j个= 2, . . . ,米此外，G公司_jk公司(ω)全部=0j个≠k个例如，可以显示G公司₁₂(ω) = ∫∂_ω₁日志对(θ₁|ω₁)∂_ω₂日志对(θ₂|θ_[1],ω₂)对(θ|ω)dθ=∂_ω₁ ∂_ω₂∫对(θ₁|ω₁)对(θ₂|θ₁,ω₂)dθ₂dθ₁=∂_ω₁ ∂_ω₂1 = 0. 因此ω彼此正交(Zhu等人，2007年). 此外，它是由(4)那个G公司₁₁(ω) = ∫ {∂_ω₁日志对(θ₁|ω₁)}² 对(θ₁|ω)dθ₁和G公司_日本(ω) = ∫ {∂_{ω_j个}日志对(θ_j个|θ_[j个−1],ω_j个)}² 对(θ_j个|θ_[j个−1],ω)dθ_j个对于j个⩾ 2.

结合上述结果，我们得出以下命题，其证明可以在补充材料.

P（P）提议1考虑任何贝叶斯扰动模型对ℳ给出的先验= {对(θ|ω)对(z|θ) :ω∈ Ω}.如果ω与z无关，则其贝叶斯扰动流形ℳ的度量张量与采样分布p的规格无关(z|θ).

命题1具有重要含义。独立性确保了现有的局部稳健性结果可以被视为这里开发的新方法的特例(麦卡洛赫，1989年;古斯塔夫森，1996).

例子4.考虑以下给出的贝叶斯扰动模型

\begin{array}{l} 𝒨 = {对 (z, θ | ω) = 对 (θ | ω_{对}) 对 (z | θ, ω_{秒}) : ω = {(ω_{对}^{T型}, ω_{秒}^{T型})}^{T型}, \int 对 (θ | ω_{对}) d日 θ \\ = \int 对 (z; θ, ω_{秒}) d日 z = 1}, \end{array}

在哪儿ω_对= (ω₁, . . . ,ω_米)^T型和ω_秒= (ω_米₊₁, . . . ,ω_米₊_n个)^T型假设独立于两者z和θ.我们认为ω(t吨) = (ω₁, . . . ,ω_j个₋₁,ω_j个+t吨,ω_j个₊₁, . . . ,ω_米₊_n个₎^T型具有ω(0) =ω对于每个j个∈ {1, . . . ,米+n个}. 因此，ω̇_k个(0) =dΩ_k个(0)/日期=1用于k个=j个否则为0。出租ℓ(θ|ω_对)=对数对(θ|ω_对)和ℓ(z|θ,ω_秒)=对数对(z|θ,ω_秒)，我们有

\dot{ℓ} {z, θ | ω (0)} = \sum_{k个 = 1}^{米 + n个} {\dot{ω}}_{k个} (0) \partial_{ω_{k个}} 日志 对 (z, θ | ω) = \partial_{ω_{j个}} ℓ (θ | ω_{对}) + \partial_{ω_{j个}} ℓ (z | θ, ω_{秒}) .

(5)

自ω_秒和ω_对没有共同的组件，T型_ωℳ由跨越米+n个功能包括∂_{ω_j个}ℓ(θ|ω_对)的j个= 1, . . . ,米和∂_{ω_j个}ℓ(z|θ,ω_秒)的j个=米+ 1, . . . ,米+n个请注意∂_{ω_k个}ℓ(θ|ω_对)∂_{ω_j个}ℓ(z|θ,ω_秒)对(z,θ|ω)dzdθ= ∫∂_{ω_k个}对(θ|ω_对)∂_{ω_j个}对(z|θ,ω_秒)dzdθ=∂_{ω_k个}1∂_{ω_j个}1=任何情况下保持0j个,k个因此，它由(5)的内积∂_{ω_j个}ℓ(z,θ|ω)和∂_{ω_k个}ℓ(z,θ|ω)，表示为G公司_jk公司(ω)，是

∫∂_{ω_j个}ℓ(θ|ω_对)∂_{ω_k个}ℓ(θ|ω_对)对(z, θ|ω}d日zd日θ+ ∫∂_{ω_j个}ℓ(z|θ, ω_秒)∂_{ω_k个}ℓ(z|θ, ω_秒)对(z, θ|ω}d日zd日θ.

(6)

此外(6)可以简化为б∂_{ω_j个}ℓ(θ|ω_对)∂_{ω_k个}ℓ(θ|ω_对)对(θ|ω_对)dθ自¨对(z|θ,ω_秒)第纳尔= 1. 对于j个= 1, . . . ,米和k个=米+ 1, . . . ,米+n个，它来自(6)那个<∂_{ω_j个}ℓ(z,θ|ω)∂_{ω_k个}ℓ(z,θ|ω)>自起=0∂_{ω_k个}ℓ(θ|ω_对)=0和∂_{ω_j个}ℓ(z|θ,ω_秒) = 0. 因此，ω_秒和ω_对在以下方面相互正交< ∂_{ω_j个}ℓ(z,θ|ω),∂_{ω_k个}ℓ(z,θ|ω)>.

结合上述结果，我们得到以下命题。

P（P）提议2考虑ℳ= {对(z,θ|ω) =对(θ|ω_对)对(z|θ,ω_秒): $ω = {(ω_{对}^{T型}, ω_{秒}^{T型})}^{T型}$ }.假设ω_对独立于z和бp(θ|ω_对)dθ= ∫对(z|θ,ω_秒)第纳尔= 1.考虑两条平滑曲线p{z,θ|ω₍_k个₎(t吨)}带ω₍_k个₎(t吨) = {ω₍_k个_),_对(t吨),ω₍_k个_),_秒(t吨)}^T型 这样ω₍₁₎(0) =ω₍₂₎(0) =ω和ω_(1),_对(t吨)和 ω_(2),_秒(t吨)与t无关。对于任意两个切线向量v_k个(ω) =ℓ̇{z,θ|ω₍_k个₎(0)} ∈T型_ωℳ代表k= 1, 2，我们有<v₁,v（v）₂ >(ω) = 0.

命题2具有重要含义。对于先验分布和采样分布的同时扰动，它确保ω_对和ω_秒几何上相互正交。因此，我们可以从数据和抽样分布中分离出先验的影响。

最后，我们考虑一个同时扰动模型，表示为对(z,θ|ω_对,ω_d日,ω_秒)，其中ω_对,ω_d日和ω_秒分别表示先验、数据和采样分布的个别扰动。除了命题1和命题2之外，我们还可以得到以下定理。

T型神灵1让ℳ= {对(z,θ|ω) =对(θ|ω_对)对(z|θ,ω_d日,ω_秒) :ω= (ω_对,ω_d日,ω_秒)}具有∫对(θ|ω_对)dθ= ∫对(z|θ,ω_d日,ω_秒)第纳尔= 1而ω_对 与z无关。考虑两条光滑曲线p{z,θ|ω₍_k个₎(t吨)}带ω₍_k个₎(t吨) = {ω₍_k个_),_对(t吨),ω₍_k个_),_d日(t吨),ω₍_k个_),_秒(t吨)}^T型通过 ω₍₁₎(0) =ω₍₂₎(0) =ω，有两个切向量v_k个(ω) =ℓ̇{z,θ|ω₍_k个₎(0)} ∈T型_ωℳ，k= 1, 2.然后:

如果ω_(1),_对(t吨)和{ω_(2),_d日(t吨),ω_(2),_秒(t吨)}与t无关，则<v₁,v（v）₂ >(ω) = 0;
如果{ω_(1),_对(t吨),ω_(1),_d日(t吨)}和{ω_(2),_对(t吨),ω_(2),_秒(t吨)}与t和p无关(z|θ,ω_d日,ω_秒) =对₁(z|θ,ω_d日)对₂(z|θ,ω_秒)对于任何(ω_d日,ω_秒)，然后<v₁,v（v）₂ >(ω) = 0.

对于先验、数据和采样分布的同时扰动，定理1（i）确保ω_对和(ω_d日,ω_秒)几何上相互正交。如果对(z|θ,ω_d日,ω_秒) =对₁(z|θ,ω_d日)对₂(z|θ,ω_秒)，那么ω_对,ω_d日、和ω_秒几何上相互正交。

3.影响措施及其性质

3.1. 内在影响措施

我们考虑一些目标函数，例如ϕ-发散函数、后验均值和贝叶斯因子，并开发相关的内在影响度量，用于量化扰动贝叶斯分析的三个关键元素的影响。灵敏度分析的目标函数通常被选为扰动后验分布的函数θ鉴于z，由提供对(θ|z,ω) =对(z,θ|ω)/ ∫对(z,θ|ω)dθ和对(θ|z,ω⁰)，这是θ鉴于z。这样的目标函数，表示为（f）(ω,ω⁰) =（f）{对(θ|z,ω),对(θ|z,ω⁰)}，也可以视为来自ℳ×ℳ到R（右）。在整篇论文中，我们假设（f）(ω,ω⁰)是的平滑函数ω是的路径依赖函数对(θ|z,ω)和对(θ|z,ω⁰)这样的话（f）(ω,ω)=0（任何情况下）ω∈ Ω. 例如，（f）(ω,ω⁰)可以设置为的总变化距离对(θ|z,ω⁰)和对(θ|z,ω) (Dey等人，1996年). 大多数标准影响测量，如范围(伯杰，1990年,1994)可以被视为（f）(ω,ω⁰).

这些影响测量值的很大一部分可能是由扰动引起的ω基线分布，不考虑观测数据和观测数据与拟合模型之间的差异对(z,θ). 由于任何影响分析的目的都是检测观测数据和对(z,θ)，我们建议重新缩放（f）(ω,ω⁰)使用之间的最短距离对(z,θ|ω)和对(z,θ|ω⁰). 我们明确量化了对(z,θ|ω)和对(z,θ|ω⁰)使用它们的最小测地距离，表示为d日(ω,ω⁰). 如果ℳ是一个完整的有限维黎曼流形，那么Hopf–Rinow定理说明ℳ可以通过最小测地线连接(埃克兰，1978年). 此外，如果ℳ是一个完备的无限维黎曼流形，任意两点ℳ可以通过几乎是最小测地线的路径连接(埃克兰，1978年). 我们引入了一种内在影响度量来进行比较ω和ω⁰∈Ω如下。从几何上讲，内在测度对某些重新参数化是不变的。

D类定义2比较p的内在影响度量(θ|z,ω)到p(θ|z,ω⁰)定义为数字集成电路_（f）(ω,ω⁰) =（f）(ω,ω⁰)²/d日(ω,ω⁰)².

拟议IGI_（f）(ω,ω⁰)可以解释为目标函数相对于最小距离的变化率对(z,θ|ω)和对(z,θ|ω⁰)上的ℳ.自（f）(ω,ω⁰)依赖于路径，并且d日(ω,ω⁰)对平滑重矩阵化不变量ω、IGI_（f）(ω,ω⁰)也是不变的。此外，我们建议确定最具影响力的ω单位为Ω，表示为 $\hat{ω}$ _我，最大化IGI_（f）(ω,ω⁰)为所有人ω∈ Ω.

例子5.我们考虑对数BF(ω,ω⁰)=对数б对(z,θ|ω)dθ−对数对(z,θ|ω⁰)dθ用于比较的贝叶斯因子对(z|θ,ω)和对(z|θ,ω⁰)，它可以被视为测试假设的统计数据ω反对ω⁰(Kass&Raftery，1995年). 在温和条件下，BF(ω,ω⁰)是来自的平滑映射ℳ到R（右）.我们可以设置（f）(ω,ω⁰)=高炉(ω,ω⁰)并得出内在影响测度

{IGI公司}_{B类 F类} (ω, ω^{0}) = \frac{高炉 {(ω, ω^{0})}^{2}}{d日 {(ω, ω^{0})}^{2}} .

3.2. 一阶局部影响措施

我们认为（f）{ω(t吨),ω⁰}作为t吨沿着所有可能的平滑曲线接近0对{z,θ|ω(t吨)}通过ω⁰，这是ω(0) =ω⁰.自（f）{ω(t吨),ω⁰}是来自的函数R（右）到R（右）根据泰勒级数展开（f）{ω(t吨),ω⁰} =（f）{ω(0),ω⁰} +ḟ{ω(0)}t吨+ 0.5 $\ddot{（f）}$ {ω(0)}t吨²+o个(t吨²)，其中ḟ{ω（0）}和 $\ddot{（f）}$ {ω（0）}表示的一阶和二阶导数（f）{ω(t吨),ω⁰}关于t吨评估时间：t吨= 0. 我们需要区分ḟ{ω某些光滑曲线的（0）}≠0ω(t吨)和ḟ{ω对于所有平滑曲线，（0）}=0ω(t吨). 我们首先考虑这个案子ḟ{ω某些光滑曲线的（0）}≠0ω(t吨). 让ℓ̇{z,θ|ω(0)} =v（v）∈T型_ω₍₀₎ℳ.然后，ḟ{ω(0)} =数据流[v（v）]{ω（0）}是的方向导数（f）在…的方向v（v）∈T型_ω₍₀₎ℳ(朗，1995). 我们得出以下定义。

D类定义三。一阶局部影响度量定义为金融机构_（f）[v（v）]{ω（0）}=lim_t吨→0IGI公司_（f）{ω(0),ω(t吨)} = [数据流[v（v）]{ω(0)}]²/[<v（v）,v（v）> {ω(0)}].

为了进行灵敏度分析，我们使用切线向量v（v）_F类_，最大值在里面T型_ω₍₀₎ ℳ，最大化FI_（f）[v（v）]{ω（0）}，并且对于ω（t） ●●●●。我们现在得到了以下结果。

T型神灵2数量金融机构_（f）[v（v）]{ω(0)}对ω的平滑重参数化不变量(t吨).

除了定理2中的不变性外，FI_（f）[v（v）]{ω（0）}是有限维扰动流形一阶测度的直接推广(Zhu等人，2007年;Wu和Luo，1993年).

例子5 (继续的). 我们设置了（f）{ω(t吨),ω⁰}=高炉{ω(t吨),ω⁰}. 自d日[高炉{ω(t吨),ω⁰}]/日期= ∫ℓ̇{z,θ|ω(0)}[对{z,θ|ω(0)}/ ∫对{z,θ|ω(0)}dθ]dθ= ∫ℓ̇{z,θ|ω(0)}对{θ|z,ω(0)}dθ，我们有

{金融机构}_{（f）} [v（v）] {ω (0)} = \frac{{[\int \dot{ℓ} {z, θ | ω (0)} 对 {θ | z, ω (0)} d日 θ]}^{2}}{\int \dot{ℓ} {z, θ | ω (0)}^{2} 对 {z, θ | ω (0)} d日 z d日 θ} .

计算FI相对容易_（f）[v（v）]{ω（0）}表示特定扰动。例如，对于前面给出的污染对{θ|ω(t吨)} =对(θ) +t吨{克(θ) −对(θ)}，可以看出

{金融机构}_{（f）} [v（v）] {ω (0)} = \frac{{(\int [克 (θ) {对 (θ)}^{- 1} - 1] 对 {θ | z, ω (0)} d日 θ)}^{2}}{\int {[克 (θ) {对 (θ)}^{- 1} - 1]}^{2} 对 (θ) d日 θ} = \frac{{[对_{克} (z) {对 (z)}^{- 1} - 1]}^{2}}{\int {[克 (θ) {对 (θ)}^{- 1} - 1]}^{2} 对 (θ) d日 θ},

哪里对(z) = ∫对(z|θ)对(θ)dθ和对_克(z) = ∫克(θ)对{z|θ,ω(0)}dθ.由于对_克(z)至对(z)贝叶斯因素有利于克(θ)与对(θ)，芬兰_（f）[v（v）]{ω（0）}是标准化贝叶斯因子的平方克(θ)与对(θ).

例子6.考虑贝叶斯扰动流形ℳ= {对(z,θ|ω) :ω∈ Ω ⊂R（右）^米}和对{z,θ|ω(t吨)}作为上的平滑曲线ℳ，其中ω不是的函数z和θ例如均值漂移模型中的扰动方案，以及ω(t吨) = {ω₁(t吨), . . . ,ω_米(t吨)}^T型是一个平滑向量t吨.让v（v）_小时= (v（v）_小时_,1, . . . ,v（v）_{h、米})^T型=dΩ(0)/日期.通过使用链式法则，我们得到

\begin{array}{l} v（v） {ω (0)} = d日 ℓ {z, θ | ω (t吨)} / d日 t吨 |_{t吨 = 0} = \sum_{k个 = 1}^{米} {\dot{ω}}_{k个} (t吨) \partial_{ω_{k个}} ℓ {z, θ | ω (0)} = \sum_{k个 = 1}^{米} {v（v）}_{小时, k个} \partial_{ω_{k个}} ℓ {z, θ | ω (0)}, \\ d日 （f） [v（v）] {ω (0)} = d日 （f） {ω (t吨), ω^{0}} / d日 t吨 |_{t吨 = 0} = \sum_{k个 = 1}^{米} {v（v）}_{小时, k个} \partial_{ω_{k个}} （f） {ω (0)} = {v（v）}_{小时}^{T型} \partial_{ω} （f） {ω (0)}, \\ < v（v）, v（v） > {ω (0)} = \sum_{j个, k个 = 1}^{米} {v（v）}_{小时, j个} {v（v）}_{小时, k个} < \partial_{ω_{j个}} ℓ {z, θ | ω (0)} \partial_{ω_{k个}} ℓ {z, θ | ω (0)} > {ω (0)} \\ = {v（v）}_{小时}^{T型} G公司 {ω (0)} {v（v）}_{小时}, \end{array}

(7)

哪里∂_{ω_k个}（f）(ω)表示的一阶偏导数（f）(ω,ω⁰)关于ω_k个和G公司{ω(0)} = ∫[∂_ωℓ{z,θ|ω(0)}]^⊗2 对(z,θ|ω)dzdθ是一个米×米Fisher信息矩阵ω因此，它由(7)以及金融机构的定义_（f）[v（v）]{ω（0）}表示 ${金融机构}_{（f）} [v（v）] {ω (0)} = {[d日（f） [v（v）] {ω (0)}]}^{2} / [< v（v）, v（v） > {ω (0)}] = {[{v（v）}_{小时}^{T型} \partial_{ω} （f） {ω (0)}]}^{2} / {v（v）}_{小时}^{T型} G公司 {ω (0)} {v（v）}_{小时}$ 最后，我们得到v（v）_F类_，最大值{ω（0）}=argmax_v（v）金融机构_（f）[v（v）]{ω(0)} = [G公司{ω(0)}]⁻¹^/² ∂_ω（f）{ω(0)}.

3.3. 二级局部影响措施

我们使用 $\ddot{（f）}$ {ω（0）}评估ω到统计模型(Zhu等人，2007年). 然而，对于一般平滑曲线ω(t吨)上的ℳ, $\ddot{（f）}$ {ω（0）}在几何上表现不好(朗，1995;Zhu等人，2007年). 我们只考虑测地线对{z,θ|ω(t吨)}，用Exp表示_ω₍₀₎(电视)，通过Exp_ω₍₀₎(电视) |_t吨₌₀=ω（0）带初始方向ℓ̇{z,θ|ω(0)} =v（v）{ω(0)} ∈T型_ω₍₀₎ℳ它来自泰勒级数展开(朗，1995;Zhu等人，2007年)那个

（f） {{费用}_{ω (0)} (t吨 v（v）), ω^{0}} = （f） {ω (0), ω^{0}} + t吨 d日 （f） [v（v）] {ω (0)} + 0.5 {t吨}^{2} \ddot{（f）} {{费用}_{ω (0)} (t吨 v（v）)} |_{t吨 = 0} + o个 {(t吨)}^{2},

(8)

哪里 $\ddot{（f）}$ {支出_ω₍₀₎(电视)} =d日²（f）{支出_ω₍₀₎(电视),ω⁰}/日期².几何上， $\ddot{（f）}$ {支出_ω₍₀₎(电视)} |_t吨₌₀在里面(8)称为黎曼黑森，用黑森表示(（f）)(v（v）,v（v）){ω(0)} (朗，1995). 黎曼-黑森函数是对称的。现在我们引入一个二阶影响度量。

D类定义4.v方向上的二阶影响测量∈T型_ω₍₀₎ℳ定义为硅_（f）[v（v）]{ω（0）}=Hess(（f）)(v（v）,v（v）){ω(0)}/[<v（v）,v（v）> {ω(0)}].

几何，SI_（f）[v（v）]{ω（0）}对标量变换和平滑变换是不变的。为了进行灵敏度分析，我们使用切线向量v（v）_S公司_，最大值∈T型_ω₍₀₎ℳ，使SI最大化_（f）[v（v）]{ω（0）}代表全部v（v）∈T型_ω₍₀₎ℳ有限维空间和无限维空间中的二阶测度之间存在直接联系。因此，本文提出的诊断方法可以被视为现有局部影响方法的扩展(库克，1986年;Zhu等人，2007年)到无限维设置。

例子6,继续的。我们考虑示例6中的贝叶斯扰动模型。如果数据流[v（v）]{ω（0）}=0表示全部v（v）∈T型_ω₍₀₎ℳ然后是赫斯(（f）)(v（v）,v（v）){ω（0）｝减少到 ${v（v）}_{小时}^{T型} {H（H）}_{（f）} {ω (0)} {v（v）}_{小时}$ ，其中 ${H（H）}_{（f）} {ω (0)} = \partial_{ω}^{2} （f） {ω (0)}$ ，其中 $\partial_{ω}^{2} （f） {ω (0)}$ 表示的二阶偏导数（f）(ω,ω⁰)关于ω(Zhu等人，2007年). 在这种情况下， $硅_{（f）} [v（v）] {ω (0)} = {v（v）}_{小时}^{T型} {H（H）}_{（f）} (ω, ω^{0}) {v（v）}_{小时} / {v（v）}_{小时}^{T型} G公司 {ω (0)} {v（v）}_{小时}$ 和v（v）_S公司_，最大值等于的特征向量G公司(ω)⁻¹^/² H（H）_（f）{ω(0)}G公司(ω)⁻¹^/²对应于其最大特征值。让e（电子）_j个成为米×1矢量j个第th个元素1，否则为0。我们还建议绘制SI指数图_（f）[e（电子）_j个]审查有影响力的案件(Zhu等人，2007年第2572页）。

3.4. 贝叶斯影响分析

现在，我们总结了执行我们建议的影响分析的四个关键步骤。

步骤1.构造贝叶斯扰动模型对(z,θ|ω).
步骤2.给定贝叶斯扰动模型，我们计算几何量，例如<v（v）,v（v）> {ω摄动流形的（0）}。
步骤3.选择目标函数（f）(ω,ω⁰)并计算IGI_（f）(ω,ω⁰)和 $\hat{ω}$ _我=argmax（最大值）_ω∈ΩIGI公司_（f）(ω,ω⁰)

在步骤3中，我们需要计算（f）(ω,ω⁰)和d日(ω,ω⁰). 自（f）(ω,ω⁰)是的函数对(θ|z,ω)和对(θ|z,ω⁰)，我们使用马尔可夫链蒙特卡罗方法从对(θ|z,ω)和对(θ|z,ω⁰)然后评估（f）(ω,ω⁰) (Chen等人，2000年). 我们使用Dijkstra算法(Dijkstra，1959年)以近似计算对(z,θ|ω)和对(z,θ|ω⁰). 该方法的主要思想是将模型离散化{对(z,θ|ω) :ω∈Ω}到更简单的空间{对(z,θ|ω) :ω∈ Ω_D类}，其中Ω_D类包含一组Ω的细化网格点，然后我们近似d日(ω,ω⁰) (Dijkstra，1959年). 基于细化网格点集Ω_D类，然后计算{IGI_（f）(ω,ω⁰) :ω∈ Ω_D类}和近似值 $\hat{ω}$ _我通过使用argmax_{ω∈ Ω_D类}IGI公司_（f）(ω,ω₀).

步骤4.如果数据流[v（v）]{ω（0）}≠0，然后我们计算v（v）_F类_，最大值评估小扰动对模型的局部影响。然而，如果数据流[v（v）]{ω（0）}表示全部为0v（v），然后计算SI_（f）[v（v）]{ω（0）}并查找v（v）_S公司_，最大值=argmax[SI（最大值）_（f）[v（v）]{ω(0)}].

在步骤4中，我们需要计算FI_（f）[v（v）]{ω（0）}和SI_（f）[v（v）]{ω(0)}. 对于许多无限维流形，例如加法∊-污染等级，v（v）在一组中变化𝒱，可以用有限数量的网格点很好地近似{v（v）_我:我= 1, . . . ,K（K）₀}. 我们可以近似计算argmax_v（v）[金融机构_（f）[v（v）]{ω（0）｝]和argmax_v（v）[国际单位制_（f）[v（v）]{ω（0）}]通过argmax_{v（v）_我}[金融机构_（f）[v（v）_我]{ω（0）}]和argmax_{v（v）_我}[国际单位制_（f）[v（v）_我]{ω（0）}。

4.一个理论示例

我们考虑数据集z= (z₁, . . . ,z_n个)^T型以说明我们提出的诊断方法的潜在应用。假设z₁, . . . ,z_n个独立于N个(θ，1）分布和基线先验分布θ是对应于 $N个 (μ_{0}, σ_{0}^{2})$ 分配。出租 $\bar{z} = \sum_{我 = 1}^{n个} z_{我} / n个$ ，我们有 $对 (θ | z) \propto 经验 [- 0.5 (n个 + 1 / σ_{0}^{2}) {θ - (n个 \bar{z} + μ_{0} / σ_{0}^{2}) / (n个 + 1 / σ_{0}^{2})}^{2}]$ .

我们首先考虑基线先验位置的简单扰动，其扰动模型由下式给出

对 (z, θ | ω) = 对 (z | θ) 对 (θ | ω) = 对 (z | θ) 经验 {- 0.5 {(θ - ω - μ_{0})}^{2} / σ_{0}^{2}} / {(2 π σ_{0}^{2})}^{0.5}

对于ω∈ [ω_L（左）,ω_U型]，其中ω_L（左）和ω_U型是已知的标量。我们设置了 $E类 (θ | z, ω) = \int θ 对 (θ | z, ω) d日 θ = {n个 \bar{z} + (ω + μ_{0}) / σ_{0}^{2}} / (n个 + 1 / σ_{0}^{2})$ 和（f）(ω,ω⁰) =E类(θ|z,ω) −E类(θ|z,ω⁰). 因此，遵循伯杰（1990），我们有（f）(ω,ω⁰)等于 $（f） (ω_{U型}, ω^{0}) - （f） (ω_{L（左）}, ω^{0}) = (ω_{U型} - ω_{L（左）}) / (n个 σ_{0}^{2} + 1)$ 。大范围可能由ω_U型−ω_L（左），这与先验扰动的大小有关，如后文所示。

我们计算了对(z,θ|ω)以及内在影响测度。我们可以计算对(z,θ|ω_L（左）)和对(z,θ|ω_U型). 自ω(t吨) =t吨和 $\dot{ℓ} {z, θ | ω (t吨)} = (θ - μ_{0} - t吨) / σ_{0}^{2}$ ，我们有 $< \dot{ℓ} {z, θ | ω (t吨)} = \dot{ℓ} {z, θ | ω (t吨)} > {ω (t吨)} = 1 / σ_{0}^{2}$ 和 $d日 (ω_{L（左）}, ω_{U型}) = \int_{ω_{L（左）}}^{ω_{U型}} d日 t吨 / σ_{0} = (ω_{U型} - ω_{L（左）}) / σ_{0}$ ，这是与数据无关的先验值的唯一扰动大小。两者都很小σ₀和大型ω_U型−ω_L（左）可能会引入大扰动。什么时候？（f）(ω,ω⁰) =E类(θ|z,ω) −E类(θ|z,ω⁰)，我们有 ${IGI公司}_{（f）} (ω, ω^{0}) = σ_{0}^{2} / {(n个 σ_{0}^{2} + 1)}^{2}$ ，独立于ω这表明相对于先验扰动，（f）(ω,ω⁰)变化不大。大范围错误地表明了非稳健性的程度，这实际上是由对先验值的大扰动引起的(Sivaganesan，2000年).

其次，我们考虑先验值和模型的同时扰动，如下所示

对 (z, θ | ω) \propto 经验 {- 0.5 \sum_{我 = 1}^{n个} {(z_{我} - ω_{我} - θ)}^{2} - 0.5 {(θ - μ_{0} - ω_{n个 + 1})}^{2} / σ_{0}^{2}},

(9)

哪里ω= (ω₁, . . . ,ω_n个₊₁₎^T型∈R（右）^n个⁺¹在这种情况下，ω⁰= 0_n个₊₁表示无扰动。让δ_ij公司等于1我=j个否则为0。根据示例6，我们可以为我,j个= 1, . . . ,n个,

\begin{array}{l} \partial_{ω_{我}} ℓ (z, θ | ω) = (z_{我} - ω_{我} - θ), \partial_{ω_{n个 + 1}} ℓ (z, θ | ω) = (θ - μ_{0} - ω_{n个 + 1}) / σ_{0}^{2}, \\ < \partial_{ω_{我}} ℓ (z, θ | ω), \partial_{ω_{j个}} ℓ (z, θ | ω) > (ω) = δ_{我 j个}, < \partial_{ω_{我}} ℓ (z, θ | ω), \partial_{ω_{n个 + 1}} ℓ (z, θ | ω) > (ω) = 0, \\ < \partial_{ω_{n个 + 1}} ℓ (z, θ | ω), \partial_{ω_{n个 + 1}} ℓ (z, θ | ω) > (ω) = 1 / σ_{0}^{2} . \end{array}

(10)

因此，当σ₀≠ 1,ω_我对于我= 1, . . . ,n个和ω_n个₊₁在拟合模型中引入不同程度的扰动对(z,θ|ω). 此外，由于< ∂_{ω_我}ℓ(z,θ|ω),∂_{ω_j个}ℓ(z,θ|ω) > (ω)为所有人我,j个独立于ω、歧管ℳ由确定(9)是扁平歧管(朗，1995). 对于任何ω在里面R（右）^n个⁺¹，测地线连接对(z,θ|ω)和对(z,θ|ω⁰)由给定对(z,θ;tω)的t吨∈ [0, 1]. 通过使用(3)，我们可以证明 $d日 {(ω, ω^{0})}^{2} = \sum_{我 = 1}^{n个} ω_{我}^{2} + ω_{n个 + 1}^{2} / σ_{0}^{2}$ ，它量化了扰动方案的大小(9)到先前的和拟合的模型。

我们计算贝叶斯因子BF的对数(ω,ω⁰)如实施例5所述。由于指数函数中的项(9)形成的二次函数θ，我们可以显式计算BF(ω,ω⁰) =P（P）(ω) −P（P）(ω⁰)，其中P（P）(ω)=对数б对(z,θ|ω)dθ等于

C - 0.5 [{(ω_{n个 + 1} + μ_{0})}^{2} / σ_{0}^{2} + \sum_{我 = 1}^{n个} {(z_{我} - ω_{我})}^{2} - {(ω_{n个 + 1} + μ_{0}) / σ_{0}^{2} + \sum_{我 = 1}^{n个} (z_{我} - ω_{我})}^{2} / (n个 + 1 / σ_{0}^{2})],

和C是独立于的标量ω现在回顾示例5的结果。对于平滑曲线ω(t吨) ∈R（右）^n个⁺¹具有ω(0) =ω⁰，芬兰_（f）[v（v）]{ω（0）}由确定∂_ω高炉(ω,ω⁰)和v（v）_F类_，最大值(ω) = {G公司(ω⁰)}^−1/2∂_ω高炉(ω,ω⁰)，其中 $G公司 (ω^{0}) = 诊断 (1, \dots, 1, σ_{0}^{- 2})$ 按中计算(10).取BF的导数(ω,ω⁰)关于ω，我们得到

\begin{array}{l} \partial_{ω_{n个 + 1}} 高炉 (ω, ω^{0}) = - (ω_{n个 + 1} + μ_{0}) / σ_{0}^{2} + {(ω_{n个 + 1} + μ_{0}) / σ_{0}^{2} + \sum_{我 = 1}^{n个} (z_{我} - ω_{我})} / (n个 σ_{0}^{2} + 1), \\ \partial_{ω_{我}} 高炉 (ω, ω^{0}) = z_{我} - ω_{我} - {(ω_{n个 + 1} + μ_{0}) / σ_{0}^{2} + \sum_{我 = 1}^{n个} (z_{我} - ω_{我})} / (n个 + 1 / σ_{0}^{2}) \end{array}

对于我= 1, . . . ,n个，它产生

{v（v）}_{F类, 最大值} (ω^{0}) = {z_{1} - \frac{n个 \bar{z} + μ_{0} / σ_{0}^{2}}{n个 + 1 / σ_{0}^{2}}, \dots, z_{n个} - \frac{n个 \bar{z} + μ_{0} / σ_{0}^{2}}{n个 + 1 / σ_{0}^{2}}, \frac{n个 (\bar{z} - μ_{0}) σ_{0}}{n个 σ_{0}^{2} + 1}}^{T型} .

(11)

通过检查第一个n个的组件v（v）_F类_，最大值(ω⁰)，我们可以识别外围点z_我与后验平均值相差甚远θ，而的最后一个组件v（v）_F类_，最大值(ω⁰)可以提取一个有影响力的超参数μ₀.

第三，我们考虑先验分布和采样分布的同时扰动，

对 (z, θ | ω) \propto 经验 {- 0.5 \sum_{我 = 1}^{n个} ω_{我} {(z_{我} - θ)}^{2} - 0.5 ω_{n个 + 1} {(θ - μ_{0})}^{2} / σ_{0}^{2} + 0.5 \sum_{我 = 1}^{n个 + 1} 日志 (ω_{我}),}

哪里ω= (ω₁, . . . ,ω_n个₊₁)^T型∈R（右）^n个⁺¹在这种情况下，ω⁰= 1_n个₊₁表示无扰动。根据示例6，我们可以为我,j个= 1, . . . ,n个,

\begin{array}{l} \partial_{ω_{我}} ℓ (z, θ | ω) = - 0.5 {(z_{我} - θ)}^{2} + 0.5 ω_{我}^{- 1}, \\ \partial_{ω_{n个 + 1}} ℓ (z, θ | ω) = - 0.5 {(θ - μ_{0})}^{2} / σ_{0}^{2} + 0.5 ω_{n个 + 1}^{- 1}, \\ < \partial_{ω_{我}} ℓ (z, θ | ω) = \partial_{ω_{j个}} ℓ (z, θ | ω) > (ω) = 0.5 ω_{我}^{- 2} δ_{我 j个}, \\ < \partial_{ω_{我}} ℓ (z, θ | ω), = \partial_{ω_{n个 + 1}} ℓ (z, θ | ω) > (ω) = 0, \\ < \partial_{ω_{n个 + 1}} ℓ (z, θ | ω), \partial_{ω_{n个 + 1}} ℓ (z, θ | ω) > (ω) = 0.5 ω_{n个 + 1}^{- 2} . \end{array}

(12)

因此，G公司(ω⁰)是一个(n个+ 1) × (n个+1）单位矩阵。

我们考虑预测分布的敏感性分析(拉文，1992年;Millar和Stewart，2007年). 让z_n个₊₁表示将来的观察结果N个(θ，1），预测密度z_n个₊₁鉴于z，表示为对(z_n个₊₁|z,ω)，显示为 $N个 {(\sum_{我 = 1}^{n个} ω_{我} z_{我} + ω_{n个 + 1} μ_{0} / σ_{0}^{2}) / (\sum_{我 = 1}^{n个} ω_{我} + ω_{n个 + 1} / σ_{0}^{2}), 1 / (\sum_{我 = 1}^{n个} ω_{我} + ω_{n个 + 1} / σ_{0}^{2})}$ .我们设置（f）(ω,ω⁰) = ∫z_n个₊₁ 对(z_n个₊₁|z,ω)第纳尔_n个₊₁− ∫z_n个₊₁ 对(z_n个₊₁|z,ω⁰)第纳尔_n个₊₁现在回顾示例6的结果和中的度量张量(12).对于平滑曲线ω(t吨) ∈R（右）^n个⁺¹具有ω(0) =ω⁰，芬兰_（f）[v（v）]{ω（0）}由ψ决定_ω（f）(ω)和v（v）_F类_，最大值(ω) =∂_ω（f）(ω,ω⁰)，由给出

\begin{array}{l} \partial_{ω_{n个 + 1}} （f） (ω, ω^{0}) = σ_{0}^{- 2} μ_{0} / (\sum_{我 = 1}^{n个} ω_{我} + ω_{n个 + 1} / σ_{0}^{2}) \\ {- σ_{0}^{- 2} (ω_{n个 + 1} μ_{0} / σ_{0}^{2} + \sum_{我 = 1}^{n个} z_{我} ω_{我}) / (\sum_{我 = 1}^{n个} ω_{我} + ω_{n个 + 1} / σ_{0}^{2})}^{2}, \\ \partial_{ω_{我}} （f） (ω, ω^{0}) = z_{我} / (\sum_{我 = 1}^{n个} ω_{我} + ω_{n个 + 1} / σ_{0}^{2}) \\ {- (ω_{n个 + 1} μ_{0} / σ_{0}^{2} + \sum_{我 = 1}^{n个} z_{我} ω_{我}) / (\sum_{我 = 1}^{n个} ω_{我} + ω_{n个 + 1} / σ_{0}^{2})}^{2} \end{array}

对于我= 1, . . . ,n.（名词）。这就产生了v（v）_F类_，最大值_,(ω⁰)与…成比例

\frac{1}{n个 + 1 / σ_{0}^{2}} {(z_{1} - \frac{n个 \bar{z} + μ_{0} / σ_{0}^{2}}{n个 + 1 / σ_{0}^{2}}, \dots, z_{n个} - \frac{n个 \bar{z} + μ_{0} / σ_{0}^{2}}{n个 + 1 / σ_{0}^{2}} + \frac{n个 (μ_{0} - \bar{z}) σ_{0}^{2}}{n个 σ_{0}^{2} + 1})}^{T型} .

(13)

我们观察到v（v）_F类_，最大值_,(ω⁰)英寸(13)与v（v）_F类_，最大值(ω⁰)英寸(11)，因此v（v）_F类_，最大值(ω⁰)能够拾取外围点z_我和一个有影响力的超参数μ₀.

最后，我们研究一个更一般的设置，其中z_我(我= 1, . . . , 50）是独立的N个(θ_我，1）变量，使用θ_我之前的Dirichlet过程独立生成DP公司(c（c）₀F类₁)，其中基本度量值F类₁是一个N个（5，1）分布与置信参数c（c）₀设置为等于2(埃斯科瓦尔，1994年). 此外z_我已更改为z_我+5用于我=49和50，可以视为两个异常值。我们将模型与z_我∼N个(θ_我，1）和θ_我∼DP公司(2F类₀)，其中F类₀是一个N个（0，1）分布。基本衡量标准F类₀由于N个（0，1）和真基度量N个(5, 1). 我们考虑先验和数据的同时扰动。我们有

\begin{array}{l} 对 (z, θ | ω) \propto 经验 (- 0.5 \sum_{我 = 1}^{n个} {(z_{我} - ω_{我} - θ_{我})}^{2} \\ + \sum_{我 = 1}^{n个} 日志 [{c（c）}_{0} {F类}_{0} (θ_{我}) + {c（c）}_{0} ω_{n个 + 1} {{F类}_{1} (θ_{我}) - {F类}_{0} (θ_{我})} + \sum_{j个 = 1}^{我 - 1} δ_{θ_{j个}} (θ_{我})]) . \end{array}

(14)

在这种情况下，ω⁰= 0_n个₊₁表示无扰动。通过差异化ℓ(z,θ|ω)=对数对(z,θ|ω)英寸(14)关于ω，我们有这个我= 1, . . . ,编号：，

\begin{array}{l} \partial_{ω_{我}} ℓ (z, θ; ω) = z_{我} - ω_{我} - θ_{我}, \\ \partial_{ω_{n个 + 1}} ℓ (z, θ | ω) = \sum_{我 = 1}^{n个} \frac{{c（c）}_{0} {{F类}_{1} (θ_{我}) - {F类}_{0} (θ_{我})}}{{c（c）}_{0} {F类}_{0} (θ_{我}) + {c（c）}_{0} ω_{n个 + 1} {{F类}_{1} (θ_{我}) - {F类}_{0} (θ_{我})} + \sum_{j个 = 1}^{我 - 1} δ_{θ_{j个}} (θ_{我})} . \end{array}

自¨(z_我−ω_我−θ_我)对(z,θ|ω)第纳尔=0和б(z_我−ω_我−θ_我)(z_j个−ω_j个−θ_j个)对(z,θ|ω)第纳尔=δ_ij公司，我们有

\begin{array}{l} < \partial_{ω_{我}} ℓ (z, θ | ω), \partial_{ω_{j个}} ℓ (z, θ | ω) > (ω) = δ_{我 j个}, < \partial_{ω_{我}} ℓ (z, θ | ω), \partial_{ω_{n个 + 1}} ℓ (z, θ | ω) > (ω) = 0, \\ < \partial_{ω_{n个 + 1}} ℓ (z, θ | ω), \partial_{ω_{n个 + 1}} ℓ (z, θ | ω) > (ω) = E类 [{\partial_{ω_{n个 + 1}} ℓ (z, θ | ω)}^{2}] . \end{array}

类似(11)，我们设置（f）(ω,ω⁰)=高炉(ω,ω⁰)并将结果替换为(7)计算v（v）_F类_，最大值(ω⁰)使用由后验分布生成的50000马尔可夫链蒙特卡罗样本对(θ₁, . . . ,θ_n个|z₁, . . . ,z₅₀)5000个样品老化后。检查v（v）_F类_，最大值(ω⁰)揭示了异常情况49和50，并显示了对指定错误的基本度量的敏感性F类₀Dirichlet过程之前θ_我在里面图1.

保存图片、插图等的外部文件。对象名称为biomet-98-2-307f1.jpg

在单独的窗口中打开

图1

使用Dirichlet过程先验和扰动个别观测值的同时扰动模型：（a）局部影响度量v（v）_B类_，最大值(ω⁰)贝叶斯因子的对数（f）(ω,ω⁰)=高炉(ω,ω⁰)从中检测出异常情况49和50以及对Dirichlet过程先验的扰动；（b）度量张量的指数图克_ii（ii）(ω⁰)对于摄动（15）。

除此理论示例外，还提供了涉及缺失数据的广泛模拟和实际数据分析补充材料在实践中，我们建议采用迭代过程来执行§3.4中的四步影响分析。如果人们担心对先验的敏感性，那么可以像示例1中那样，对先验所有超参数引入一些有限维扰动，并根据其局部影响度量来识别有影响的超参数。然后，对于几个有影响的超参数，其中一个使用加法进一步扰动其相关的先验分布∊-然后进行内在影响分析。如果关注采样分布，则可能会引入各种扰动，包括加法扰动∊-污染类别与扰动模型(1)到对(z|θ)并使用局部影响测量来检测对(z|θ)对小扰动很敏感。然后，可以关注这些有影响力的部分并进行内在影响分析。在细化先验分布和采样分布后，可以扰动单个观测值并检测一组有影响的观测值。在检查了每个影响分析的信息后，我们对z,对(θ)和对(z|θ). 我们从局部影响分析开始，检查所有成分的敏感性，然后使用内在影响分析重点关注几个有影响的成分。

鸣谢

我们感谢编辑、一位副主编和两位审稿人提出的许多宝贵建议，这些建议极大地改进了本文。

附录

命题证明1.考虑任意两条平滑曲线对{z,θ|ω₍_k个₎(t吨)} =对{θ|ω_(k个)(t吨)}对(z|θ)带有对{z,θ|ω₍_k个₎(0)} =对(θ|ω)对(z|θ)的k个= 1, 2. 对于每个k个，通过差异化ℓ{z,θ|ω₍_k个₎(t吨)}关于t吨，我们得到一个切线向量v（v）_k个(ω) =ℓ{z,θ|ω₍_k个₎(0)} =d日日志对{θ|ω₍_k个₎(t吨)}/日期|_t吨₌₀∈T型_ωℳ，独立于对(z|θ). 此外d日_t吨=日/日，的内积v（v）₁(ω)和v（v）₂(ω)由∏给出[d日_t吨日志对{θ|ω₍₁₎(t吨)}][d日_t吨日志对{θ|ω₍₂₎(t吨)}]对{z,θ|ω}dzdθ= ∫ [d日_t吨日志对{θ|ω₍₁₎(t吨)}][d日_t吨日志对{θ|ω₍₂₎(t吨)}]对{θ|ω}dθ，它也独立于对(z|θ).

命题证明2.考虑两条平滑曲线对{z,θ|ω₍_k个₎(t吨)}与ω₍_k个₎(t吨) = {ω₍_k个_),_对(t吨)^T型, {ω₍_k个_),_秒(t吨)^T型}^T型这样的话ω₍₁₎(0) =ω₂(0) =ω和(ω_(1),_对(t吨)和ω_(1),_秒(t吨)独立于t吨.让ℓ(z|θ,ω_(1),_秒)=对数对(z|θ,ω_(1),_秒). 自ω_(1),_对(t吨)独立于t吨,

{v（v）}_{1} (ω) = \dot{ℓ} {z, θ | ω_{(1)} (0)} = \frac{d日}{d日 t吨} 日志 对 {θ | ω_{(1), 对} (t吨)} |_{t吨 = 0} + \frac{d日}{d日 t吨} 日志 对 {z | θ, ω_{(1), 秒} (t吨)} |_{t吨 = 0} \dot{ℓ} {z | θ, ω_{(1), 秒} (0)} .

让ℓ(θ|ω_(2),_对)=对数对(θ|ω_(2),_对). 同样，我们有

{v（v）}_{2} (ω) = \dot{ℓ} {z, θ | ω_{(2)} (0)} = \frac{d日}{d日 t吨} 日志 对 {θ | ω_{(2), 对} (t吨)} |_{t吨 = 0} \dot{ℓ} {θ | ω_{(2), 对} (0)} .

因此v（v）₁(ω)和v（v）₂(ω)，表示为<v₁,v（v）₂ >(ω)，由给出

\begin{array}{l} \int \dot{ℓ} {θ | ω_{(2), 对} (0)} \dot{ℓ} {z | θ, ω_{(1), 秒} (0)} 对 (z, θ | ω) d日 z d日 θ & = \int \frac{d日 对 {θ | ω_{(2), 对} (0)}}{d日 t吨} \frac{d日 对 {z | θ, ω_{(1), 秒} (0)}}{d日 t吨} d日 z d日 θ \\ = \int (\frac{d日 对 {θ | ω_{(2), 对} (0)}}{d日 t吨} [\int \frac{d日 对 {z | θ, ω_{(1), 秒} (0)}}{d日 t吨} d日 z]) d日 θ \\ = \int (\frac{d日 对 {θ | ω_{(2), 对} (0)}}{d日 t吨} \frac{d日 [\int d日 对 {z | θ, ω_{(1), 秒} (0)} d日 z]}{d日 t吨}) d日 θ \\ = \int [\frac{d日 对 {θ | ω_{(2), 对} (0)}}{d日 t吨} \frac{d日 1}{d日 t吨}] d日 θ = 0 . \end{array}

定理的证明1.由于定理1（i）来自命题2，因此我们将重点放在定理1（ii）上。自{ω_(1),_对(t吨),ω_(1),_d日(t吨)}和{ω_(2),_对(t吨),ω_(2),_秒(t吨)}独立于t吨和对(z|θ,ω_d日,ω_秒) =对₁(z|θ,ω_d日)对₂(z|θ,ω_秒)，我们有

\begin{array}{l} {v（v）}_{1} (ω) = \dot{ℓ} {z, θ | ω_{(1)} (0)} = \frac{d日}{d日 t吨} 日志 对_{1} {z | θ, ω_{(1), 秒} (t吨)} |_{t吨 = 0}, \\ {v（v）}_{2} (ω) = \dot{ℓ} {z, θ | ω_{(2)} (0)} = \frac{d日}{d日 {t吨}^{'}} 日志 对_{2} {z | θ, ω_{(2), d日} ({t吨}^{'})} |_{{t吨}^{'} = 0} . \end{array}

因此，<v₁,v（v）₂ >(ω)由给定

\begin{array}{l} {\int \frac{d日 日志 对_{1} {z | θ, ω_{(1), 秒} (t吨)}}{d日 t吨} |}_{t吨 = 0} {\frac{d日 日志 对_{2} {z | θ, ω_{(2), d日} ({t吨}^{'})}}{d日 {t吨}^{'}} |}_{{t吨}^{'} = 0} 对 (z, θ | ω) d日 z d日 θ \\ = \int \frac{d日 对_{1} {z | θ, ω_{(1), 秒} (0)}}{d日 t吨} \frac{d日 对_{2} {z | θ, ω_{(2), d日} (0)}}{d日 {t吨}^{'}} 对 (θ | ω_{对}) d日 z d日 θ = \frac{{d日}^{2} 1}{d日 t吨 d日 {t吨}^{'}} = 0 . \end{array}

定理的证明2.考虑平滑曲线对{z,θ|ω(t吨)}. 让R（右）(秒) : [c（c）₁,c（c）₂] → [−∊, ∊]是一阶微分映射R（右）(c（c）_三)=0和Ṙ(c（c）_三) =博士(秒)/ds公司|_{秒=c（c）_三}对于a≠0c（c）_三∈ (c（c）₁,c（c）₂). 然后，对[z,θ|ω{R（右）(秒)}]是来自的微分图[c（c）₁,c（c）₂]至ℳ根据链式法则ḟ[ω{R（右）(秒)}] =d日_秒 （f）[ω{R（右）(秒)},ω⁰] =d日_第页 （f）{ω(第页),ω⁰}Ṙ(秒)和d日_秒ℓ[z,θ|ω{R（右）(秒)}] =d日_第页 ℓ{z,θ|ω(第页)}Ṙ(秒)，其中Ṙ(秒) =d日_秒 R（右）(秒),d日_c（c）=直流电,d日_第页=付款/付款、和d日_秒=日/日因此，作为ω(0) =ω⁰，我们有

d日 （f） [\dot{R（右）} ({c（c）}_{三}) v（v）] [ω {R（右） ({c（c）}_{三})}] = \dot{R（右）} ({c（c）}_{三}) d日 （f） [v（v）] (ω), 和 < \dot{R（右）} ({c（c）}_{三}) v（v）, \dot{R（右）} ({c（c）}_{三}) v（v） > (ω) = \dot{R（右）} {({c（c）}_{三})}^{2} < v（v）, v（v） > (ω) .

补充材料

补充材料可在生物特征在线课程包括命题1的证明、缺失数据问题的真实数据分析和广泛的模拟。

单击此处查看。^{（1.0M，pdf格式）}

工具书类

阿玛里S。统计学中的微分几何方法。第2版。第28卷。柏林：施普林格；1990年，统计学讲义。[谷歌学者]
稳健贝叶斯分析：对先验的敏感性。J统计计划推断。1990;25:303–28. [谷歌学者]
Berger JO。稳健贝叶斯分析概述。测试。1994;三:5–58. [谷歌学者]
Berger JO、Rios Insoa D、Ruggeri F.In：贝叶斯稳健稳健贝叶斯分析。统计学课堂讲稿。Rios Insoa D，Ruggeri F，编辑。第152卷。纽约：Springer；2000年，第1-32页。[谷歌学者]
Carlin BP，Polson NG。影响诊断的预期效用方法。J Am统计协会。1991;86:1013–21. [谷歌学者]
Chen MH、Shao QM、Ibrahim JG。贝叶斯计算中的蒙特卡罗方法。纽约：Springer；2000.[谷歌学者]
Clarke B.Desiderata，学习统计学的预测理论。贝叶斯分析。2010;5:283–318. [谷歌学者]
Clarke B，Gustafson P.关于后验分布对输入的总体敏感性。J统计计划推断。1998;71:137–50. [谷歌学者]
Cook RD。地方影响评估（讨论）J.R.统计。社会学学士。1986;48:133–69. [谷歌学者]
Copas JB，Eguchi S.局部模型不确定性和不完全数据偏差（讨论）J.R.统计。社会学学士。2005;67:459–513. [谷歌学者]
Dey DK，Birmiwal LR。使用散度度量的稳健贝叶斯分析。统计Prob Lett。1994;20:287–94. [谷歌学者]
Dey DK、Ghosh SK、Lou KR。关于贝叶斯分析中的局部敏感性度量（含讨论）。收录：Berger JO、Betro B、Moreno E、Pericchi LR、Ruggeri F、Salinetti G、Wasserman L，编辑。贝叶斯稳健。第29卷。加利福尼亚州海沃德；1996年，第21-40页。IMS演讲笔记-专题系列。[谷歌学者]
Dijkstra东部。关于与图有关的两个问题的注记。数字数学。1959;1:269–71. [谷歌学者]
Ekeland I.无穷维Hopf–Rinow定理。J差异几何。1978;13:287–301. [谷歌学者]
Escobar MD。使用Dirichlet过程估计正常平均值。J Am统计协会。1994;89:268–77. [谷歌学者]
Friedrich T.Die Fisher-信息与症状结构。数学Nachr。1991;153:273–96. [谷歌学者]
Gustafson P.推断对先验边缘的局部敏感性。J Am统计协会。1996;91:774–81. [谷歌学者]
Gustafson P.贝叶斯分析中的局部稳健性。收录：Rios Insoa D、Ruggeri F，编辑。稳健贝叶斯分析。纽约：Springer；2000年，第71–88页。[谷歌学者]
Gustafson P，Wasserman L.贝叶斯推理的局部敏感性诊断。安·统计师。1995;23:2153–67. [谷歌学者]
Guttman I，Peña D.贝叶斯分析单变量线性模型中的诊断。统计师。西尼卡。1993;三:367–90. [谷歌学者]
Kass RE，Raftery AE.贝叶斯因子。J Am统计协会。1995;90:773–95. [谷歌学者]
Kass RE、Tierney L、Kadane JB。贝叶斯分析中评估影响和敏感性的近似方法。生物特征。1989;76:663–74. [谷歌学者]
Kass RE、Vos PW。渐近推理的几何基础。纽约：威利；1997[谷歌学者]
朗·S。微分流形和黎曼流形。第三版，纽约：Springer；1995[谷歌学者]
Lavine M.具有共轭先验的贝叶斯线性模型中的局部预测影响。Commun公司。统计师。B。1992;2:269– 83. [谷歌学者]
McCulloch RE。局部模型影响。J Am统计协会。1989;84:473–78. [谷歌学者]
Millar RB，Stewart WS。贝叶斯模型中局部影响观察的评估。贝叶斯分析。2007;2:365–84. [谷歌学者]
Oakley JE，O'Hagan A.复杂模型的概率敏感性分析：贝叶斯方法。J.R.统计。Soc.B.公司。2004;66:751–69. [谷歌学者]
Peña D，Guttman I.比较线性模型中异常值检测的概率方法。生物特征。1993;80:603–10. [谷歌学者]
Peng F，Dey DK。使用散度度量对异常值问题进行贝叶斯分析。Can J统计。1995;23:199–213. [谷歌学者]
Ruggeri F，Sivaganesan S.关于贝叶斯推断的全局敏感性度量。桑赫亚。2000;62:110–27. [谷歌学者]
Sivaganesan S.全局和局部稳健性方法：使用和限制。收录：Rios Insoa D、Ruggeri F，编辑。稳健贝叶斯分析。第152卷。纽约：Springer；2000年，第89–108页。统计学课堂讲稿。[谷歌学者]
Van der Linde A.乘性扰动模式下后验分布的局部影响。贝叶斯分析。2007;2:319–32. [谷歌学者]
Wang Q，Stefanski LA，Genton MG，Boos DD。通过测量误差建模进行稳健时间序列分析。中央统计局。2009;19:1263–80. [谷歌学者]
Wu X，Luo Z。局部影响的二阶方法。J.R.统计。社会学学士。1993;55:929–36. [谷歌学者]
Zhu HT、Ibrahim JG、Lee SY、Zhang HP。局部影响分析中的扰动选择和影响措施。安·统计师。2007;35:2565–88. [谷歌学者]
朱HT，李SY.不完全数据模型的局部影响。J.R.统计。社会学学士。2001;63:111–26. [谷歌学者]

文章来自生物特征由以下人员提供牛津大学出版社