Generalization of Jeffreys Divergence-Based Priors for Bayesian Hypothesis Testing

（a） $π^{S公司} (-)$ ⁠, $π^{M（M）} (- \cdot - \cdot)$ ⁠, $π^{A类} (\dots \dots -)$ 和 $π^{F类} (- -)$ 用于指数测试 $μ_{0}$ 和（b）上限 ${B类}_{12}^{0} (n个, π)$ 贝叶斯因子的函数n个对于之前的 $π^{S公司} (-)$ ⁠, $π^{M（M）} (- \cdot \cdot \cdot)$ ⁠, $π^{A类} (\dots)$ 和 $π^{F类} (- -)$

一些有趣的特性值得注意（记住，没有力矩和重尾是测试先验的理想特性）。

（a）
在对数刻度中 $π^{M（M）}$ 和 $π^{S公司}$ 周围对称（单峰） $日志 (μ_{0})$ ⁠；这符合Berger和Delampady（1987）和伯杰和塞尔克（1987）提案，自 $日志 (μ)$ 是（渐近地）一个位置参数。
（b）
所有四个前题都是正确的。
（c）
算术内禀和DB先验都没有矩；分数包含所有的矩。
（d）
$π^{M（M）}$ 尾巴最重 $π^{F类}$ 最薄的。 $π^{S公司}$ 尾巴比 $π^{A类}$ ⁠.
（e）
所有四个先验值都“居中”于空值 $μ_{0}$ ⁠；的确， $μ_{0}$ 是DB之前和 $π^{A类}$ ⁠，这是 $π^{F类}$ （指数密度）。

在巴亚里和加西亚·多纳托（2008），相应的贝叶斯因子 ${B类}_{12}$ 针对各种情况进行计算。我们发现四个前驱的结果非常相似 ${B类}_{12}^{S公司}$ 和 ${B类}_{12}^{A类}$ 为模型提供稍微更多的支持 ${M（M）}_{1}$ 比 ${B类}_{12}^{M（M）}$ 和 ${B类}_{12}^{F类}$ 当数据与兼容时 ${M（M）}_{1}$ ⁠.

我们调查证据一致性下一步。很容易证明，如果 $\bar{年} \to \infty$ ⁠，然后 ${B类}_{12} \to 0 \forall n个$ ⁠，无论使用什么先验来计算贝叶斯因子。以下引理为 ${B类}_{12} \to 0$ 什么时候 $\bar{年} \to 0$ ⁠。证据出现在附录A.

引理2。让 ${B类}_{12}^{π}$ 是使用计算的贝叶斯因子 $π (μ) . {B类}_{12}^{π} \to 0$ 作为 $\bar{年} \to 0$ ⁠，对于所有人 $n个 ⩾ k个 > 0$ 当且仅当

\int_{0}^{1} μ^{- k个} π (μ) d日 μ = \infty .

(16)

由此可见，所有四个优先考虑生产证据一致所有人的贝叶斯因素 $n个 ⩾ 1$ ⁠顺便说一句，有趣的是，如果我们使用 ${q个}^{*} = \underline{q个} + δ$ 具有 $δ > 1$ 在定义1中， $π^{S公司}$ 不会有一致的证据 $\bar{年} \to 0 \forall n个 ⩾ 1$ ⁠.

最后，我们研究了 ${B类}_{12}$ 作为支持模型的证据 ${M（M）}_{1}$ 增长（即 $\bar{年} \to μ_{0}$ ⁠). 对于这个例子，很容易看出，当 $\bar{年} \to μ_{0}, {B类}_{12}$ ⁠，增长到一个常数， ${B类}_{12}^{0} (n个, π)$ 比如说，这只取决于n个以及先前使用的。在图1我们展示 ${B类}_{12}^{0} (n个, π)$ 对于所考虑的四个优先事项。可以看出 $π^{S公司}$ 是产生最大值的先验值 ${B类}_{12}^{0}$ 对于的所有值n个，与那些 $π^{A类}$ 紧跟其后。（当然， ${B类}_{12}^{0} (n个, π) \to \infty$ 作为 $n个 \to \infty$ ⁠.)

3.2位置-比例（示例2）

通常为向量参数定义DB优先级θ作为一个例子，我们接下来考虑一个更常见的例子，即正态分布；这里是二维的θ有两个不同性质的组件（位置和规模）。具体来说，假设 $（f） (年 ∣ μ, σ) = N个 (年 ∣ μ, σ^{2})$ ⁠，我们想测试 ${H（H）}_{1} : (μ, σ) = (μ_{0}, σ_{0})$ 与 ${H（H）}_{2} : (μ, σ) \neq (μ_{0}, σ_{0})$ ⁠.

为了计算DB优先级，我们使用引用优先级 $π^{N个} (μ, σ) = σ^{- 1}$ ⁠；我们获得之前的总DB $π^{S公司} (μ, σ) = π^{S公司} (σ) π^{S公司} (μ ∣ σ)$ ⁠，其中

\begin{matrix} π^{S公司} (σ) \propto \frac{σ}{{(σ_{0}^{4} + σ^{4})}^{1 / 2} {(σ_{0}^{2} + σ^{2})}^{1 / 2}}, \\ π^{S公司} (μ ∣ σ) = C类 一 (μ ∣ μ_{0}, \frac{σ_{0}^{4} + σ^{4}}{σ_{0}^{2} + σ^{2}}), \end{matrix}

其中Ca表示柯西密度。在本例中，最小DB优先 $π^{M（M）}$ 不存在。可以检查到 $π^{S公司} (μ ∣ σ)$ 周围对称 $μ_{0}$ ⁠，它是中的位置参数 $π^{S公司} (μ ∣ σ); σ_{0}$ 是中的比例参数 $π^{S公司} (σ)$ ⁠.

接下来导出了形式更简单、尾部更薄的固有先验函数（省略了证明）。

引理3。算术内在先验是 $π^{A类} (μ, σ) = π^{A类} (σ) π^{A类} (μ ∣ σ)$ ⁠，使用

\begin{matrix} π^{A类} (σ) = \frac{2}{π} \frac{σ_{0}}{σ^{2} + σ_{0}^{2}}, \\ π^{A类} (μ ∣ σ) = N个 (μ ∣ μ_{0}, \frac{σ^{2} + σ_{0}^{2}}{2}) . \end{matrix}

在分数阶固有先验下 $π^{F类}, μ$ 和σ是独立的先验的有边缘的

\begin{aligned} π^{F类} (σ) = {N个}^{+} (σ Ş 0, \frac{σ_{0}^{2}}{2}), \\ π^{F类} (μ) = N个 (μ ∣ μ_{0}, \frac{σ_{0}^{2}}{2}), \end{aligned}

哪里 ${N个}^{+}$ 表示截断为正实线的法向密度。

两个内在先验都是适当的；此外，与之前的总和DB一样， $μ_{0}$ 和 $σ_{0}$ 是的位置和比例参数 $μ ∣ σ$ 和σ分别是。分数先验的尾部是最薄的（这种差异对于先验特别显著σ). 中探讨的示例巴亚里和加西亚·多纳托（2008）产生相应的贝叶斯因子 ${B类}_{12}^{S公司}$ 和 ${B类}_{12}^{A类}$ 非常相似，然而 ${B类}_{12}^{F类}$ 在某些情况下可能会有明显的不同。

之前的三次，在图2我们显示了σ(图2（b）)和的条件分布μ鉴于σ(图2（a）). 可以清楚地看到 $π^{F类} (σ)$ 尾巴比 $π^{A类} (σ)$ 和 $π^{S公司} (σ)$ ⁠。此外，的所有条件优先级μ围绕其模式对称 $μ_{0}$ ⁠，使用 $π^{S公司} (μ ∣ σ)$ 有最重的尾巴。注意，算术内禀和DB先验是最相似的；这种行为发生在我们所探索的大多数例子中。

图2。

测试先验（μ0，σ0）=（0,1）−（a）条件分布πS（）、πa（………）和πF（− −) μ给定σ=3和（b）边际分布πS（）、πA（………）和πF（− −) σ（对于πA的πS（0,1）和对于πF的πF（0,0.48），这些边缘的对（模式、中值）分别为（0.81,1.56）

测试前 $(μ_{0}, σ_{0}) = (0, 1) - (一)$ 条件分布 $π^{S公司}$ (), $π^{A类} (\dots \dots)$ 和 $π^{F类} (- -)$ 属于μ鉴于σ=3和（b）边际分布 $π^{S公司}$ (), $π^{A类} (\dots \dots)$ 和 $π^{F类} (- -)$ 属于σ（这些边缘的对（模式、中位数）为（0.81、1.56） $π^{S公司} (0, 1)$ 对于 $π^{A类}$ 和（0，0.48）用于 $π^{F类}$ ⁠)

关于贝叶斯因子的证据一致性，很容易证明，当 $\bar{年} \to \infty, \bar{年} \to - \infty$ 或 $S公司 \to \infty$ （针对模型的证据 ${M（M）}_{1}$ 非常强壮），那么 ${B类}_{12} \to 0$ ⁠, $\forall n个$ ⁠，以及所考虑的三个先验。当证据支持模型时 ${M（M）}_{1}$ 是最大的（即。 $(\bar{年}, S公司) \to (μ_{0}, σ_{0}))$ 可以看出，贝叶斯因素有利于 ${M（M）}_{1}$ 增长到一定的常数 ${B类}_{12}^{1} (n个, π)$ ⁠，它仅是的函数n个和之前使用的。图3说明了其速率 ${B类}_{12}^{1} (n个, π) \to \infty$ 作为 $n个 \to \infty$ ⁠可以清楚地看到，DB和算术内在先验的行为非常相似，对支持模型的证据更加敏感 ${M（M）}_{1}$ 比分数优先，除非n个非常小。

图3。

贝叶斯因子的上界B121（n，π）作为先验πS（−）、πF（−−）和πa（………）的n函数

上限 ${B类}_{12}^{1} (n个, π)$ 贝叶斯因子的函数n个对于之前的 $π^{S公司} (-)$ ⁠, $π^{F类} (- -)$ 和 $π^{A类} (\dots \dots \dots)$

3.3不规则模型（示例3）

有一类重要的模型，其参数空间受数据约束。这些模型没有规则的渐近性，因此基于渐近理论的解决方案（如贝叶斯信息准则BIC）不适用。此外，这些模型对内在方法非常具有挑战性；事实上，正如伯杰和佩里奇（2001），分数贝叶斯因子是完全不合理的（因此分数固有先验是无用的），而算术固有先验（仅针对单边问题推导）是“一种推测”(伯杰和佩里奇（2001）,逐字记录). 这里我们采用最简单的此类模型，即位置未知的指数分布。因此，假设 $（f） (年 ∣ θ) = 经验 {- (年 - θ)}, 年 > θ$ ⁠，并且我们想要测试 ${H（H）}_{1} : θ = θ_{0}$ 与 ${H（H）}_{2} : θ \neq θ_{0}$ ⁠。据我们所知，文献中没有针对该测试问题提出客观的先验。

在这些情况下，和对称的KL散度 ${D类}^{S公司} [θ, θ_{0}]$ 是∞，所以我们必须使用最小值。可以检查一下 ${\bar{D类}}^{M（M）} [θ, θ_{0}] = 2 | θ - θ_{0} |$ ⁠这是一个定义明确的分歧。也， $π^{N个} (θ) = 1$ 自从θ是位置参数。最小DB先验值由下式给出

π^{M（M）} (θ) = \frac{1}{2} {(1 + 2 | θ - θ_{0} |)}^{- 三 / 2}, θ \in R（右）,

相对于 $θ_{0}$ （正如预期，因为θ是位置参数）；也， $π^{M（M）}$ 没有片刻。图4（a）显示 $π^{M（M）} (θ)$ 什么时候 $θ_{0} = 0$ ⁠.

图4。

（a） H1的双侧测试的不规则示例πM：θ=0和（b）θ0=0情况下的不规则单侧测试问题（−，πM；…，πa）

（a）不规则示例 $π^{M（M）}$ 用于双面测试 ${H（H）}_{1} : θ = 0$ 和（b）案件的不规则单边测试问题 $θ_{0} = 0 (-, π^{M（M）}; \dots, π^{A类})$

接下来我们将调查任何n个。足够的统计数据是 $T型 = 最小值 {年_{1}, \dots, 年_{n个}}$ ⁠。事实上 ${B类}_{12} \to 0$ ⁠，作为 $T型 \to - \infty$ 对于任何（适当的）先前（事实上， ${B类}_{12} = 0$ 对于 $T型 < θ_{0}$ ⁠). 下一个引理提供了产生证据一致性之前的充分条件 $\forall n个$ ⁠，何时 $T型 \to \infty$ ⁠；证明如下附录A.

引理4。让 $π (θ$ （在模型上）是任何适当的先验 ${M（M）}_{2}$ ⁠)和 ${B类}_{12}^{π}$ 是相应的贝叶斯因子。如果是某个整数 $k个 > 0$

\int_{θ_{0}}^{\infty} 经验 (k个 θ) π (θ) d日 θ = \infty,

(17)

然后 ${B类}_{12}^{π} \to 0$ 作为 $T型 \to \infty, \forall n个 ⩾ k个$ ⁠.

从引理3可以得出 $π^{M（M）}$ 生产证据一致贝叶斯因子 $\forall n个 ⩾ 1$ ⁠.增加证据的行为赞成模型的 ${M（M）}_{1}$ 与前一示例非常相似，未进行描述（请参见巴亚里和加西亚·多纳托（2008）详细信息）。

如前所述，文献中似乎没有关于双边测试问题的任何其他建议。然而，伯杰和佩里奇（2001）考虑过“单边测试”版本，即测试 ${H（H）}_{1} : θ = θ_{0}$ 与 ${H（H）}_{2} : θ > θ_{0}$ ⁠；他们推测这个问题的算术内在先验是适当的密度

π^{A类} (θ) = (- 经验 (θ - θ_{0}) 日志 {1 - 经验 (θ_{0} - θ)} - 1), θ > θ_{0},

它是一个递减的无界函数θ。我们接下来将此问题之前的最小DB与伯杰和佩里奇（2001）建议。

虽然我们最初的公式似乎是双边测试（见问题（1）），但实际上它足以定义Θ适当地覆盖其他测试情况。例如，在我们的单面测试中，我们 $Θ = [θ_{0}, \infty)$ ⁠。之前的最小DB为

π^{M（M）} (θ) = {1 + 2 (θ - θ_{0})}^{- 三 / 2}, θ > θ_{0} .

可以检查一下 $π^{A类}$ 满足条件（17） $k个 = 1$ 因此 $π^{A类}$ 产生证据一致的贝叶斯因子 $\forall n个 ⩾ 1$ ⁠.院长 $π^{A类}$ 和 $π^{M（M）}$ 显示在图4（b）。我们再次发现DB $π^{M（M）}$ 尾巴更厚。

在这种单边测试场景中（与双边测试中的行为形成鲜明对比），贝叶斯因素有利于模型 ${M（M）}_{1}$ 对于每个 $n个 > 0$ 会增长到∞（而不是取决于n个)作为支持的证据 ${M（M）}_{1}$ 生长。的确， ${B类}_{12} \to \infty$ 什么时候 $T型 \to θ_{0}^{+}, \forall n个 > 0$ ⁠，无论使用什么先验值。注意，这里， $θ_{0}$ 位于参数空间的边界上。

在表1，我们生成用 $π^{A类}$ 和 $π^{M（M）}$ 什么时候 $θ_{0} = 0$ 对于各种值 $T型 = 最小值 {年_{1}, \dots, 年_{n个}}$ ⁠、和用于 $n个 = 10$ 和 $n个 = 20$ ⁠。对于较小的值 $T型 (T型 < 0.20)$ ⁠，当证据支持模型时 ${M（M）}_{1}, {B类}_{12}^{M（M）}$ 远大于 ${B类}_{12}^{A类}$ ⁠从而为 ${M（M）}_{1}$ ⁠。对于更大的值T型（即当数据与模型相矛盾时 ${M（M）}_{1}$ ⁠)这两个先验都会产生非常相似的贝叶斯因子。

表1

不规则模型，单侧测试：值 ${B类}_{12}$ 对于各种值T型和n个以及之前的两次 $π^{A类}$ 和 $π^{M（M）}$ ⁠，测试时 $θ_{0} = 0$

T型	的结果 $n个 = 10$		的结果 $n个 = 20$
	${B类}_{12}^{M（M）}$	${B类}_{12}^{A类}$	${B类}_{12}^{M（M）}$	${B类}_{12}^{A类}$
0.02	46.56	11.54	41.96	10.52
0.05	16.66	5.16	12.65	4.04
0.10	6.83	2.57	3.75	1.50
0.20	2.19	1.02	0.55	0.28
0.50	0.16	0.10	0.002	0.002
1	0.002	0.001	$2 \times 10^{- 7}$	$2 \times 10^{- 7}$

T型	的结果 $n个 = 10$		的结果 $n个 = 20$
	${B类}_{12}^{M（M）}$	${B类}_{12}^{A类}$	${B类}_{12}^{M（M）}$	${B类}_{12}^{A类}$
0.02	46.56	11.54	41.96	10.52
0.05	16.66	5.16	12.65	4.04
0.10	6.83	2.57	3.75	1.50
0.20	2.19	1.02	0.55	0.28
0.50	0.16	0.10	0.002	0.002
1	0.002	0.001	$2 \times 10^{- 7}$	$2 \times 10^{- 7}$

新标签中打开

表1

不规则模型，单侧测试：值 ${B类}_{12}$ 对于各种值T型和n个以及之前的两次 $π^{A类}$ 和 $π^{M（M）}$ ⁠，测试时 $θ_{0} = 0$

T型	的结果 $n个 = 10$		的结果 $n个 = 20$
	${B类}_{12}^{M（M）}$	${B类}_{12}^{A类}$	${B类}_{12}^{M（M）}$	${B类}_{12}^{A类}$
0.02	46.56	11.54	41.96	10.52
0.05	16.66	5.16	12.65	4.04
0.10	6.83	2.57	3.75	1.50
0.20	2.19	1.02	0.55	0.28
0.50	0.16	0.10	0.002	0.002
1	0.002	0.001	$2 \times 10^{- 7}$	$2 \times 10^{- 7}$

T型	的结果 $n个 = 10$		的结果 $n个 = 20$
	${B类}_{12}^{M（M）}$	${B类}_{12}^{A类}$	${B类}_{12}^{M（M）}$	${B类}_{12}^{A类}$
0.02	46.56	11.54	41.96	10.52
0.05	16.66	5.16	12.65	4.04
0.10	6.83	2.57	3.75	1.50
0.20	2.19	1.02	0.55	0.28
0.50	0.16	0.10	0.002	0.002
1	0.002	0.001	$2 \times 10^{- 7}$	$2 \times 10^{- 7}$

新标签中打开

3.4混合料模型（示例4）

混合模型是客观贝叶斯方法最具挑战性的场景之一。这些模型有不适当的可能性，即没有不适当的先验产生有限边缘密度的可能性（综合可能性）。最近，佩雷斯和伯杰（2001）已使用预期后验（请参见佩雷斯和伯杰（2002）)推导客观估计先验，但基本上似乎没有通用的方法来推导客观先验，以便用这些模型进行测试。

然而，散度度量定义得很好（尽管现在更涉及积分），在用于模型选择之前提供了一个合理的DB。我们考虑一个简单的例子。假设

（f） (年 ∣ μ, 第页) = 第页 N个 (年 ∣ 0, 1) + (1 - 第页) N个 (年 ∣ μ, 1),

和测试 ${H（H）}_{1} : μ = 0$ 与 ${H（H）}_{2} : μ \neq 0$ ⁠，其中 $第页 < 1$ 已知（如果 $第页 = 1$ ⁠，这两个假设定义了相同的模型）。作为伯杰和佩里奇（2001）指出，该问题没有最小训练样本，因此无法定义固有贝叶斯因子。分数贝叶斯因子也不存在。对于这个问题，我们唯一知道的是伯杰和佩里奇（2001）使用的 $π^{B类 P（P）} (μ) = C类一 (μ ∣ 0, 1)$ ⁠.

虽然没有正式的 $π^{N个} (μ)$ 在这里， $π^{N个} (μ) = 1$ 通常假设（参见示例佩雷斯和伯杰（2002）). 可以看出 $π^{M（M）}$ 不存在，但之前的总和DB $π^{S公司}$ 确实存在。然而， ${D类}^{S公司} [μ, μ_{0}]$ （因此归一化常数）不能以封闭形式导出。当然可以使用数值程序计算 ${D类}^{S公司}$ ⁠，但我们推导了拉普拉斯近似值（参见坦纳（1996）). 由于有效样本量的自然选择是 ${n个}^{*} = n个 (1 - 第页)$ ⁠，我们获得

{\bar{D类}}^{S公司} [μ, μ_{0}] = \frac{{D类}^{S公司} (μ, μ_{0})}{n个 (1 - 第页)} \approx 日志 [\frac{1 + {(1 - 第页) / 第页} 经验 (μ^{2} / 2)}{1 + {(1 - 第页) / 第页} 经验 (- μ^{2} / 2)}] = {\bar{D类}}^{S公司 L（左）} [μ, μ_{0}],

在给出之前，我们使用它来推导（近似）DB的建议 $π^{S公司 L（左）} (μ) \propto {1 + {\bar{D类}}^{S公司 L（左）} (μ, μ_{0})}^{- 1}$ ⁠，模式为0。

这种近似特别有吸引力，因为它还保留了所建议的散度测度的基本性质，因此 $π^{S公司 L（左）}$ 也可以解释为从定义1派生不同的发散测度 ${D类}^{S公司 L（左）}$ ⁠该近似的适用性及其一些性质在巴亚里和加西亚·多纳托（2008）.

有趣的是，之前 $π^{S公司 L（左）}$ 接近柯西密度，这是伯杰和佩里奇的建议，尽管规模不同。如所示巴亚里和加西亚·多纳托（2008），其中几个关键比较 $π^{S公司 L（左）}$ ⁠，其Cauchy近似和伯杰和佩里奇（2001）之前也考虑了。在这个例子中，DB之前（以及Berger和Pericchi提案）再次为所有人生成证据一致的贝叶斯因子n个事实上，可以证明，如果 $年_{我}$ s趋于∞或 $- \infty$ ⁠则无论使用何种先验，相应的贝叶斯因子都趋于0。

4.干扰参数

在本节中，我们将讨论更现实的问题，其中数据的分布不是在空（最简单）模型下完全指定的，而是取决于一些讨厌的参数。假设 $年_{我}$ ⁠, $我 = 1, \dots, n个$ ⁠，是独立的（不一定是IID），并且 $年 = (年_{1}, \dots, 年_{n个}) \sim {（f） (年 ∣ θ, ν), θ \in Θ, ν \in Υ}$ ⁠。我们想测试 ${H（H）}_{1} : θ = θ_{0}$ 与 ${H（H）}_{2} : θ \neq θ_{0}$ ⁠等效地，我们想解决模型选择问题（2），其中明确承认ν在每个模型中可以有不同的含义。

然而，从现在开始，如果需要，在进行适当的重新参数化后，我们假设θ和ν是正交的（即Fisher信息矩阵是块对角线）。因此，习惯上认为ν在两种模型下具有相同的含义（参见伯杰和佩里奇（1996）用于渐近证明）。这将有助于差异度量具有直观的含义，也有助于在ν在这两种模型下，大大简化了评估任务。正交参数在存在模型不确定性的情况下的适用性首先通过杰弗里斯（1961）并被许多其他人成功使用（参见示例Zellner和Siow（1980年、1984年）和克莱德等。(1996)). 对于单变量θ,考克斯和里德（1987）明确提供了一个正交重参数化。

因此，我们假设上述假设检验问题等同于在竞争模型之间进行选择：

{M（M）}_{1} : {（f）}_{1} (年 Ş ν) = （f） (年 Ş θ_{0}, ν) 与 {M（M）}_{2} : {（f）}_{2} (年 ∣ θ, ν) = （f） (年 ∣ θ, ν),

(18)

哪里 $θ_{0} \in Θ$ 是指定值，并且ν（该旧参数在Jeffreys的术语中）被认为是这两种模型的共同点，其区别仅在于新参数θ模型下 ${M（M）}_{2}$ ⁠.

4.1分歧措施

之间差异的基本度量θ和 $θ_{0}$ 也是KL定向散度（5），其中ν被认为是相同的在两种型号中：

K（K） L（左） [(θ_{0}, ν) : (θ, ν)] = \int [日志 {（f） (年 ∣ θ, ν)} - 日志 {（f） (年 ∣ θ_{0}, ν)}] （f） (年 ∣ θ, ν) d日 年 .

使用相同的ν只有当ν在两种模型下具有相同的含义，因此可以认为是通用的。事实上，佩雷斯（2005），使用几何参数，表明在正交性下 $吉隆坡 [(θ_{0}, ν) : (θ, ν)]$ 可以解释为衡量 ${（f）}_{1}$ 和 ${（f）}_{2}$ 仅由于感兴趣的参数θ这一解释不适用于其他分歧度量，如中定义的内在损失分歧贝尔纳多和鲁埃达（2002）.

类似于第2节，我们通过将KL定向发散相加或取其最小值来对称化KL定向散度，从而在θ和 $θ_{0}$ 对于给定的ν

{D类}^{S公司} [(θ, θ_{0}) ∣ ν] = K（K） L（左） [(θ, ν) : (θ_{0}, ν)] + K（K） L（左） [(θ_{0}, ν) : (θ, ν)]

(19)

和

{D类}^{M（M）} [(θ, θ_{0}) ∣ ν] = 2 最小值 {吉隆坡 [(θ, ν) : (θ_{0}, ν)], K（K） L（左） [(θ_{0}, ν) : (θ, ν)]} .

(20)

${D类}^{M（M）}$ 由使用佩雷斯（2005）来定义他所说的“正交固有损耗”。

在下文中，许多定义和属性都适用于 ${D类}^{S公司}$ 和 ${D类}^{M（M）}$ ⁠，在这种情况下，我们再次使用D类通常表示它们中的任何一个。它们的基本特性在中进行了讨论第2节和以前一样，DB previor的构建块是发散的酉测度 $\bar{D类} = D类 / {n个}^{*}$ ⁠，其中 ${n个}^{*}$ 是的有效样本量θ.

4.2存在干扰参数时基于差异的先验

用于测试 ${H（H）}_{1} : θ = θ_{0}$ 与 ${H（H）}_{2} : θ \neq θ_{0}$ ⁠，或在模型之间进行等效选择 ${M（M）}_{1}$ 和 ${M（M）}_{2}$ 在表达式（18）中，我们需要先决条件 $π_{1} (ν)$ 模型下 ${M（M）}_{1}$ 和 $π_{2} (ν, θ)$ 在下面 ${M（M）}_{2}$ ⁠.

本着杰弗里斯（以及其他许多追随者）的精神，我们（在每个模型下）相同的公共参数的客观先验（可能不合适）ν以及新参数条件分布的适当先验 $θ ∣ ν$ 模型下 ${M（M）}_{2}$ ⁠，其推导类似于第2.2条。自ν发生在两个模型中，如果我们取相同的 $π^{N个} (ν)$ 在这两种情况下，当计算贝叶斯因子时，（公共）任意常数将被抵消；然而，θ，仅出现在模型中 ${M（M）}_{2}$ ⁠，必须具有适当的优先级。旧参数的通用先验只有在以下情况下才有意义ν在两种模型中具有相同的含义（这是另一个原因θ和ν和我们一样正交）。此外，众所周知，在正交性下常见的在…之前ν对产生的贝叶斯因子几乎没有影响（参见杰弗里斯（1961）和Kass和Vaidyanathan（1992）)，从而支持对公共参数使用客观先验。

让 $π^{N个} (ν)$ 作为模型的目标（通常是Jeffreys或参考） ${M（M）}_{1}$ 然后让 $π^{N个} (θ, ν)$ 是模型的对应项 ${M（M）}_{2}$ (θ如果使用之前的引用，则会引起兴趣）。我们定义 $π^{N个} (θ ∣ ν)$ 这样的话 $π^{N个} (θ, ν) = π^{N个} (θ ∣ ν) π^{N个} (ν)$ ⁠。要定义数据库优先级，请使用D类要么是方程式（19）或方程式（20）（还可以探索其他适当的分歧措施）；然后我们有以下定义。

定义3（一般DB之前）。让

\begin{aligned} {q个}^{*} = \underline{q个} + \frac{1}{2} \underline{q个} = inf公司 {q个 ⩾ 0 : \int {1 + \bar{D类} [(θ, θ_{0}) ∣ ν]}^{- q个} π^{N个} (θ ∣ ν) d日 θ < \infty}, \\ 几乎无处不在 ν \in Υ . \end{aligned}

如果 $q个 < \infty$ ⁠，的D类-模型下的DB先验 ${M（M）}_{1}$ 是 $π_{1}^{D类} (ν) = π^{N个} (ν)$ ⁠、和在模型下 $模型 {M（M）}_{2}$ 是 $π_{2}^{D类} (θ, ν) = π^{D类} (θ ∣ ν) π^{N个} (ν)$ ⁠，其中（适当的） $π^{D类} (θ ∣ ν)$ 是

π^{D类} (θ ∣ ν) \propto {1 + \bar{D类} [(θ, θ_{0}) ∣ ν]}^{- {q个}^{*}} π^{N个} (θ ∣ ν) .

在这个定义中，我们隐含地使用了推荐的非增量函数 ${小时}_{q个} (t吨) = (1 + t吨)^{- q个}$ ⁠，但上的其他非增量函数 $t吨 \in [0, \infty)$ 可以探索。

定义4（之前的总金额和最低DB）。之前的总和DB $π^{S公司}$ 以及之前的最小DB $π^{M（M）}$ 是定义3中给出的DB优先级D类分别是 ${D类}^{S公司}$ （请参见方程式（19）)和 ${D类}^{M（M）}$ （请参见方程式（20）).

在没有干扰参数的情况下，我们建议尽可能提前使用总和DB。总的来说，它们往往表现出更好的行为，并且更容易衍生。仅当 ${D类}^{S公司}$ 不是有限的我们建议使用 $π^{M（M）}$ ⁠.

接下来，我们将研究这些DB先验函数在某些重新参数化下是否也是不变的。假设 $ξ = ξ (θ)$ 和 $η = η (ν)$ 分别是一对一单调映射 $ξ : Θ \to Θ_{ξ}$ 和 $η : Υ \to Υ_{η}$ ⁠显然，重新参数化 $(ξ, η)$ 保持正交性。与单变量情况类似，可以看出，如果 $π^{N个} (ν)$ 和 $π^{N个} (θ, ν)$ 在这些重新参数化下是不变的，DB prior也是不变的。请参见Datta和Ghosh（1995）详细分析了存在干扰参数时几个非信息先验的不变性。

因此，DB Bayes因子（使用DB先验计算的Bayes系数）不受所考虑类型的重新参数化的影响。这些是测试问题最自然、最有趣的重新参数化（实际上，其他重新参数化似乎有问题）。此外，DB优先级与命题2中的充分还原兼容。

4.3示例

接下来，我们将在几个示例中演示DB prior和相应Bayes因子的行为。首先是测试伽马模型的平均值，这通常是一个困难的问题。第二部分简要讨论线性模型。

4.3.1伽马模型（示例5）

让 $年 = (年_{1}, \dots, 年_{n个})$ 是伽马密度的IID样本，具有平均值μ、和形状参数α，即来自

（f） (年 ∣ α, μ) = {(\frac{α}{μ})}^{α} Γ (α)^{- 1} 年^{α - 1} 经验 (- \frac{年 α}{μ}) .

我们想测试一下 ${H（H）}_{1} : μ = μ_{0}$ 与 ${H（H）}_{2} : μ \neq μ_{0}$ ⁠.

很容易证明μ与…正交α.目标（参考）优先级为 $π^{N个} (α) = {ψ^{(1)} (α) - 1 / α}^{1 / 2}$ 和 $π^{N个} (μ, α) = μ^{- 1} {ψ^{(1)} (α) - 1 / α}^{1 / 2}$ ⁠，其中 $ψ^{(1)}$ 表示digamma函数。因此 $π^{N个} (μ ∣ α) = μ^{- 1}$ ⁠.

DB之前 $π^{D类} (α) = π^{N个} (α)$ 在假设和D类求和或求最小散度。低于 ${H（H）}_{2}$ ⁠，的条件和DBμ是

π^{S公司} (μ ∣ α) \propto {1 + α \frac{{(μ - μ_{0})}^{2}}{μ μ_{0}}}^{- 1 / 2} \frac{1}{μ},

条件最小DB优先为

π^{M（M）} (μ ∣ α) \propto {1 + {\bar{D类}}^{M（M）} [(μ, μ_{0}) ∣ α]}^{- 三 / 2} \frac{1}{μ}

哪里

{\bar{D类}}^{M（M）} [(μ, μ_{0}) ∣ α] = {\begin{cases} 2 α {日志 (μ / μ_{0}) - 1 + μ_{0} / μ} & 如果 μ > μ_{0}, \\ 2 α {日志 (μ_{0} / μ) - 1 + μ / μ_{0}} & 如果 μ ⩽ μ_{0} . \end{cases}

相应的贝叶斯因子在巴亚里和加西亚·多纳托（2008）并且显示非常相似。

与DB prior相比，在这个示例中派生内在prior看起来像是一项非凡的任务，我们未能获得它们的闭合形式表达式。巴亚里和加西亚·多纳托（2008）将DB贝叶斯因子与内在算术贝叶斯因子进行比较 ${IB公司}_{12}^{A类}$ （请参见伯杰和佩里奇（1996）). 我们发现，当模型 ${M（M）}_{2}$ 没错，这三项指标相当接近。当“null”模型 ${M（M）}_{1}$ 为真，方差适中。在所有这些情况下，这三项措施为真正的模型提供了支持。然而，当 ${M（M）}_{1}$ 为真且方差较小，DB Bayes因子非常合理（ ${B类}_{12}^{S公司}$ 为null模型提供最大支持），但 ${我 B类}_{12}^{A类}$ 不是，支持模型 ${M（M）}_{2}$ ⁠.这种行为 ${我 B类}_{12}^{A类}$ 可能是由于众所周知的 ${我 B类}_{12}^{A类}$ 当样本量较小时（在这种情况下，由于方差较小而恶化）。

4.3.2线性模型中的变量选择（示例6）

接下来，我们简要展示了本文的激励示例；具体来说，我们展示了DB先验如何再现线性模型中变量选择的JZS先验。线性模型中更完整的测试示例可以在巴亚里和加西亚·多纳托（2007）中给出了随机效应的DB先验值推导加西亚·多纳托和太阳（2007）.

考虑满秩一般线性模型 ${{N个}_{n个} (年 ∣ {X（X）}_{1} β_{1} + {X（X）}_{e（电子）} β_{e（电子）}, σ^{2} 我_{n个})}$ 以及测试问题 ${H（H）}_{1} : β_{e（电子）} = 0$ ⁠.在通常的正交重新参数化后（参见示例Zellner和Siow（1984）)和 $π^{N个} (β_{1}, β_{e（电子）}, σ) = σ^{- 1}$ ⁠，DB优先级为（总和和最小值）

\begin{matrix} π_{1}^{D类} (β_{1}, σ) = σ^{- 1}, \\ π_{2}^{D类} (β_{1}, β_{e（电子）}, σ) = σ^{- 1} {C类 一}_{{k个}_{e（电子）}} {β_{e（电子）} ∣ 0, {n个}^{*} σ^{2} {({V（V）}^{T型} V（V）)}^{- 1}}, \end{matrix}

哪里 ${k个}_{e（电子）}$ 是的尺寸 $β_{e（电子）}$ 和 $V（V） = (我_{n个} - {P（P）}_{1}) {X（X）}_{e（电子）}$ ⁠、和 ${P（P）}_{1} = {X（X）}_{1} {({X（X）}_{1}^{T型} {X（X）}_{1})}^{- 1} {X（X）}_{1}^{T型}$ ⁠.

注意，只有当有效样本量为 ${n个}^{*} = n个$ ⁠。这种“巧合”是具体选择 $\underline{q个} + \frac{1}{2}$ 在DB prior的定义中（参见加西亚·多纳托（2003）详细信息）。然而， ${n个}^{*}$ 可能取决于设计矩阵（或协变量）。例如，在线性模型中 $Y（Y） = X（X） θ + ε$ ⁠，使用 $X（X） n个 \times 1$ 和θ很明显，如果 $X（X） = (1, \dots, 1)^{T型}$ 然后 ${n个}^{*}$ 应该是n个但是，如果 $X（X） = (1, ε, \dots, ε)^{T型}$ 具有ɛ很小，那么 ${n个}^{*}$ 应为1。中定义的有效样本量伯杰等。(2008)满足此要求，但其他定义可能不满足。对这个问题的深入调查超出了本文的范围，将在其他地方进行。

由于文献中广泛出现了线性模型的现有客观贝叶斯测试程序之间的比较，包括用JZS先验值导出的贝叶斯因子，因此我们在此跳过它们（参见示例伯杰等。(2003),梁等。(2008)和巴亚里和加西亚·多纳托（2007）).

5.近似值和计算

在本节中，我们推导了DB之前的简单近似值，并展示了它们与现有提案的联系。我们还利用了DB Bayes因子和用通常（可能不合适）的非信息先验计算的修正Bayes系数之间的联系，提出了简单的DB Baye因子的马尔可夫链蒙特卡罗计算。

5.1基于近似发散的先验

众所周知（参见库尔贝克（1968）)通过使用预期的Fisher信息，KL散度测量值可以近似到二阶，因此

{D类}^{S公司} [(θ, θ_{0}) ∣ ν] \approx {(θ - θ_{0})}^{T型} {J型}_{θ} (θ_{0}, ν) (θ - θ_{0}) \approx {D类}^{M（M）} [(θ, θ_{0}) ∣ ν],

哪里 ${J型}_{θ} (θ_{0}, ν)$ 是Fisher信息矩阵中对应于θ，评估时间 $(θ_{0}, ν)$ ⁠因此，对于问题（18）（回忆一下θ和ν正交），DB优先 $π^{D类}$ （或 $π^{S公司}$ 或 $π^{M（M）})$ ⁠)可以近似为 $π_{1}^{D类} (ν) = π^{N个} (ν)$ 和

π^{D类} (θ ∣ ν) \propto 小时 {{(θ - θ_{0})}^{T型} \frac{{J型}_{θ} (θ_{0}, ν)}{{n个}^{*}} (θ - θ_{0})} π^{N个} (θ ∣ ν),

(21)

其中建议 ${q个}_{*}$ 是 ${q个}_{*} = \underline{q个} + \frac{1}{2}$ ⁠、和 $\underline{q个}$ 是的下确界q个-表达式（21）中定义的条件密度（现在用Fisher信息表示）适用的值。

当 $π^{N个} (θ ∣ ν)$ 不依赖于θ（所以θ作为位置参数的渐近行为）特别有趣。很容易证明 $\underline{q个} = k个 / 2$ ⁠，其中k个是的尺寸θ，因此

π^{D类} (θ ∣ ν) \approx {C类 一}_{k个} {θ ∣ θ_{0}, {n个}^{*} {J型}_{θ}^{- 1} (θ_{0}, ν)} .

(22)

许多研究人员对条件先验（22）进行了解释（例如，参见卡斯和瓦瑟曼（1995）)作为杰弗里斯多元问题思想的概括。我们刚刚表明，只有在以下情况下，该提案才能被解释为近似DB：θ是一个渐进的位置参数。

5.2贝叶斯因子的计算

有趣的是，与其他客观贝叶斯建议（如固有和分数贝叶斯因子）类似，可以证明DB-Bayes因子 ${B类}_{21}^{D类}$ 可以表示为使用非信息性（通常不正确）先验计算的未标度贝叶斯因子 ${B类}_{21}^{N个}$ ⁠乘以修正系数。此表达式还允许在以下情况下轻松计算DB Bayes因子 ${B类}_{21}^{N个}$ 很容易计算。

引理5。 对于问题（18）（带有θ和ν正交），设 ${B类}_{21}^{N个}$ 表示通过使用 $π_{1}^{N个} (ν)$ 和 $π_{2}^{N个} (θ, ν)$ ⁠；那么对于总和和最小DB先验值

{B类}_{21}^{D类} = {B类}_{21}^{N个} {E类}^{π^{N个} (θ, ν ∣ 年)} {π^{D类} (θ ∣ ν) / π^{N个} (θ ∣ ν)} .

(23)

计算 ${B类}_{21}^{N个}$ 通常很简单。在这种情况下，来自后验分布的样本（通常为马尔可夫链蒙特卡罗） $π^{N个} (θ, ν ∣ 年)$ 可用于评估方程式（23），从而简化了 ${B类}_{21}^{S公司}$ 或 ${B类}_{21}^{M（M）}$ 相当地。这实际上是我们计算贝叶斯因子的方法，例如第4.3.1节。

此外，如果n个较大（相对于尺寸 $ϕ = (θ, ν)$ ⁠我们可以通过使用后验分布的渐近表达式以及表达式（21）中给出的近似DB先验来近似方程（23）。

我们在一个简单的环境中说明了这种方法。首先，我们假设渐近后验分布由以下公式给出（参见示例中的条件伯杰（1985）) $π^{N个} (θ, ν ∣ 年) \approx N个 {\hat{ϕ}, {J型}^{- 1} (\hat{ϕ})}$ ⁠，其中 $\hat{ϕ} = (\hat{θ}, \hat{ν})$ 是（假设存在）的最大似然估计 $(θ, ν)$ 和 $J型 = {J型}_{θ} \oplus {J型}_{ν}$ 是（块对角线）预期的Fisher信息矩阵 $（f） (年 ∣ θ, ν)$ ⁠.

接下来我们假设 $π^{N个} (θ ∣ ν)$ 不依赖于θ，因此近似（条件）DB先验是近似中的Cauchy先验（22）。作为一种符号装置，它将便于书写 $π^{N个} (θ ∣ ν)$ 作为 $π^{N个} (θ_{0} ∣ ν)$ ⁠以通常的方式将柯西密度（22）表示为正态和逆伽马分布的比例混合，并使用渐近后验的DB Bayes因子，如方程式（23），可以近似为

{B类}_{21}^{D类} \approx {B类}_{21}^{N个} \iint \frac{1}{π^{N个} (θ_{0} ∣ ν)} {N个}_{k个} {\hat{θ} ∣ θ_{0}, Σ (ν, t吨)} {N个}_{第页} {ν ∣ \hat{ν}, {J型}_{ν} (\hat{ϕ})} d日 ν IGa公司 (t吨 ∣ \frac{1}{2}, \frac{1}{2}) d日 t吨,

哪里第页是的尺寸ν,k个的尺寸θ和 $Σ (ν, t吨) = t吨 {n个}^{*} {J型}_{θ}^{- 1} (θ_{0}, ν) + {J型}_{θ}^{- 1} (\hat{ϕ})$ ⁠.类似的渐近近似 ${B类}_{12}^{N个}$ 最后给出了DB Bayes因子的期望渐近近似值：

\begin{aligned} {B类}_{21}^{D类} \approx & \frac{第页 (年 ∣ \hat{ϕ})}{第页 (年 ∣ θ_{0}, \hat{ν})} (2 π)^{k个 / 2} \frac{1}{det（探测） {{J型}_{θ} (\hat{ϕ})^{1 / 2}}} \iint \frac{π^{N个} (\hat{θ} ∣ \hat{ν})}{π^{N个} (θ_{0} ∣ ν)} {N个}_{k个} {\hat{θ} ∣ θ_{0}, Σ (ν, t吨)} {N个}_{第页} {ν ∣ \hat{ν}, {J型}_{ν} (\hat{ϕ})} \\ \times IGa公司 (t吨 ∣ \frac{1}{2}, \frac{1}{2}) d日 ν d日 t吨, \end{aligned}

这很容易通过简单的蒙特卡罗抽样进行评估。请注意 $π^{N个} (θ ∣ ν)$ 在上面的表达式中取消。

6.总结与结论

通过以下方式扩展开拓性工作杰弗里斯（1961），我们提出了一类新的基于散度测度的客观贝叶斯假设检验先验，我们称之为DB先验。DB先验具有几个理想的属性，包括重新参数化下的不变性、证据一致性以及与足够统计的兼容性。我们在一系列示例中探索了DB prior，在这些示例中，DB prior被证明是直观可靠的，并且能够产生合理的Bayes因子。即使对于不规则模型和不适当的可能性也是如此，这对于其他客观贝叶斯测试方法来说是非常具有挑战性的场景。我们建议在存在总和DB先验的情况下使用它，因为它比最小DB先验更容易计算，并且似乎表现出更好的行为。

DB先验函数的行为类似于算术内在先验函数（定义时），通常更容易推导；两者都不同于分数先验。此外，在正常情况下，它们会重现杰弗里斯（1961）和Zellner和Siow（1980年、1984年）正是这些建议，所以它们可以被视为这些经典建议在非正常情况下的延伸。我们还提供了DB Bayes因子的渐近近似，这在复杂场景中很有用。然而，DB prior仅适用于嵌套比较，因此它们不如分数和内在方法一般。

我们对散度度量、非信息先验估计和有效样本量提出了具体建议。我们做出的其他明显武断的选择是 ${小时}_{q个}$ 和，共 ${q个}_{*}$ ⁠然而，他们的动机是以下论点。

（a）
选择 ${小时}_{q个} (t吨) = (1 + t吨)^{- q个}$ 是专门为在正常情况下重现JZS先验而设计的，但还有其他原因。一个令人信服的原因是，它是一个简单的函数，可以产生具有良好属性的贝叶斯因子；另一个简单的函数可以是指数， $经验 (- q个 t吨),$ 但这会导致正常的先验证据一致（请参见梁等。(2008)). 也， ${小时}_{q个}$ 结果是尾巴很重；这是一个重要的特征，以便在null模型无法很好地解释数据时，不至于压倒可能性。然而，我们不排除其他递减函数的选择 $t吨 \in [0, \infty)$ ⁠，其最大值为零，并且生成适当的DB类型优先级可以在特定场景中更好地工作。有趣的是，如果 $经验 (- q个 t吨),$ 使用，然后近似 $π^{D类}$ 在表达式（21）中，基本上是正常的单位信息，如下所定义卡斯和瓦瑟曼（1995）并由进一步研究拉夫特里（1998）.
（b）
第二个动机是选择 ${q个}^{*} = \underline{q个} + \frac{1}{2}$ ⁠原则上，任何 $\underline{q个} + δ$ 可以使用。事实上，我们并不期望δ只要是 $δ \in (0, 1)$ （这是生成重尾且无正整数矩的先验信息所必需的），但这还需要进一步研究。我们建议使用 $δ = \frac{1}{2}$ 因为这是复制杰弗里斯建议的价值。

致谢

感谢Jim Berger的评论。作者还感谢副主编和两位审稿人提出了许多有用的建议。这项研究得到了西班牙教育和科学部（MTM2007-61554）的部分资助。

工具书类

巴亚里

,

医学博士。

和

加西亚·多纳托

,

G.公司。

(

2007

)

扩展传统先验以检验线性模型中的一般假设

.

生物特征

,

94

,

135

——

152

.

巴亚里

,

医学博士。

和

加西亚·多纳托

,

G.公司。

(

2008

)

基于Jeffreys散度的贝叶斯假设检验先验的推广

.预打印arXiv:0801.4224v1（统计ME）。

伯杰

,

J.O.公司。

(

1985

)

统计决策理论与贝叶斯分析

，第2版。

纽约

:

施普林格

.

伯杰

,

J.O.公司。

,

巴亚里

,

医学博士。

,

张成泽

,

西。

,

佩里基

,

左心室。

,

雷

,

美国。

和

Visser公司

,

一、。

(

2008

)

BIC的扩展和推广

.工作文件.

国家统计科学研究所三角研究园

.

伯杰

,

J.O.公司。

和

贝尔纳多

,

J·M·。

(

1992

)关于参考先验方法的发展。在

贝叶斯统计4

（编辑

J·M·。

贝尔纳多

,

J.O.公司。

伯杰

,

A.P.公司。

Dawid公司

和

A.F.M.公司。

史密斯

)，第页。

35

——

60

.

牛津

:

牛津大学出版社

.

伯杰

,

J.O.公司。

和

德兰帕迪

,

M。

(

1987

)

测试精确的假设

.

统计师。科学。

,

三

,

317

——

352

.

伯杰

,

J.O.公司。

,

高希

,

J.K。

和

穆霍帕迪耶

,

。

(

2003

)

模型选择问题和一致性问题中贝叶斯因子的近似

.

J.统计。计划信息。

,

112

,

241

——

258

.

伯杰

,

J.O.公司。

和

莫特拉

,

J。

(

1999

)

非嵌套假设检验的默认贝叶斯因子

.

《美国统计杂志》。助理。

,

94

,

542

——

554

.

伯杰

,

J.O.公司。

和

佩里基

,

L.R.公司。

(

1996

)

用于模型选择和预测的固有贝叶斯因子

.

《美国统计杂志》。助理。

,

91

,

109

——

122

.

伯杰

,

J.O.公司。

和

佩里基

,

L.R.公司。

(

2001

)模型选择的客观贝叶斯方法：介绍和比较（带讨论）。在

型号选择

（编辑）。

第页。

拉希里

)，第页。

135

——

207

.海滩木：

数理统计研究所

.

伯杰

,

J.O.公司。

,

佩里基

,

L.R.公司。

和

瓦尔沙夫斯基

,

J.A.公司。

(

1998

)

不变情况下的Bayes因子和边际分布

.

Sankhya A公司

,

60

,

307

——

321

.

伯杰

,

J.O.公司。

和

塞尔克

,

T。

(

1987

)

检验点无效假设：P值与证据的不可调和性

.

《美国统计杂志》。助理。

,

82

,

112

——

122

.

贝尔纳多

,

J·M·。

(

2005

)

内在可信域：区间估计的客观贝叶斯方法

.

测试

,

14

,

317

——

384

.

贝尔纳多

,

J·M·。

和

鲁埃达

,

R。

(

2002

)

贝叶斯假设检验：一种参考方法

.

国际统计。修订版。

,

70

,

351

——

372

.

克莱德

,

M。

(

1999

)贝叶斯模型平均和模型搜索策略（与讨论）。在

贝叶斯统计6

（编辑

J·M·。

贝尔纳多

,

A.第页。

Dawid公司

,

J.O.公司。

伯杰

和

A.F.M.公司。

史密斯

)，第页。

157

——

185

.牛津：

牛津大学出版社

.

克莱德

,

M。

,

德西蒙

,

H。

和

帕尔米贾尼

,

G.公司。

(

1996

)

正交模型混合预测

.

《美国统计杂志》。助理。

,

91

,

1197

——

1208

.

考克斯

,

D.R.公司。

和

里德

,

N。

(

1987

)

参数正交性和近似条件推理（附讨论）

.

J.R.统计。Soc.B公司

,

49

,

1

——

39

.

达塔

,

通用标准。

和

高希

,

M。

(

1995

)

关于无信息先验的不变性

.

安。统计师。

,

24

,

141

——

159

.

德桑提斯

,

F、。

和

斯佩扎费里

,

F、。

(

1999

)

默认和稳健贝叶斯模型比较方法：分数贝叶斯因子法

.

国际统计。修订版。

,

67

,

267

——

286

.

加西亚·多纳托

,

G.公司。

(

2003

)

Bayes y因子Bayes conventionales:algunos aspectos relevantes

. 博士论文.

巴伦西亚大学统计系

,

巴伦西亚

.

加西亚·多纳托

,

G.公司。

和

太阳

,

D。

(

2007

)

单向随机效应模型中模型选择的客观先验

.

可以。J.统计。

,

35

,

1874

——

1906

.

休庭

,

J.A.公司。

,

马迪根

,

D。

,

拉夫特里

,

答：E。

和

沃林斯基

,

C.T.公司。

(

1999

)

贝叶斯模型平均：教程

.

统计师。科学。

,

14

,

382

——

417

.

易卜拉欣

,

J。

和

劳德

,

第页。

(

1994

)

设计实验分析的预测方法

.

《美国统计杂志》。助理。

,

89

,

309

——

319

.

杰弗里斯

,

H。

(

1961

)

概率论

，第3版。伦敦：

牛津大学出版社

.

卡萨丁

,

右。

和

拉夫特里

,

答：E。

(

1995

)

贝叶斯因子

.

《美国统计杂志》。助理。

,

90

,

773

——

795

.

卡萨丁

,

右。

和

瓦迪亚纳桑

,

S.K.公司。

(

1992

)

近似贝叶斯因子和正交参数，用于测试两个二项式比例的相等性

.

J.R.统计。Soc.B公司

,

54

,

129

——

144

.

卡萨丁

,

右。

和

瓦瑟曼

,

L。

(

1995

)

嵌套假设的参考贝叶斯检验及其与施瓦兹准则的关系

.

《美国统计杂志》。助理。

,

90

,

928

——

934

.

库尔贝克

,

美国。

(

1968

)

信息论与统计学

.

纽约

:

多佛出版物

.

劳德

,

P.W.公司。

和

易卜拉欣

,

J·G·。

(

1995

)

预测模型选择

.

J.R.统计。Soc.B公司

,

57

,

247

——

262

.

梁

,

F、。

,

保罗

,

R。

,

莫利纳

,

G.公司。

,

克莱德

,

M。

和

伯杰

,

J.O.公司。

(

2008

)

贝叶斯变量选择的g-prior混合

.

《美国统计杂志》。助理。

,

103

,

410

——

423

.

莫雷诺

,

E.公司。

,

贝尔托利诺

,

F、。

和

拉库尼奥

,

西。

(

1998

)

模型选择和假设检验的内在限制过程

.

《美国统计杂志》。助理。

,

93

,

1451

——

1460

.

奥哈根

,

答：。

(

1995

)

模型比较的分数贝叶斯因子（带讨论）

.

J.R.统计。Soc.B公司

,

57

,

99

——

138

.