总结

随着替代假设维度的增加,经典检验的威力往往会迅速减弱。对于参数多于观测值的高维数据尤其如此。我们讨论了经验贝叶斯模型中超参数的分数测试,作为经典测试的替代。它给出了一个通用的检验统计量,可用于针对高维备选方案检验点零假设,即使参数数量超过样本数量。该检验将被证明在零假设的邻域中平均具有最佳功效,这使其成为局部最强检验在多个维度上的适当推广。为了说明这种新的局部最强大的检验,我们更详细地研究了在线性回归模型中检验全局零假设的情况。结果表明,分数测试比F类-无论何时,在备选方案下,与小方差主成分相比,设计矩阵的大方差主成分能够解释更多的结果方差。分数测试对于检测真正高维数据中的稀疏替代方案也很有用,其威力与基于最大绝对值的测试相当t吨-统计数据。

1.简介

在线性回归模型中,我们传统上使用F类-test测试所有回归系数均为0的全局零假设。然而,众所周知F类-当模型中的协变量数接近样本数时,检验的功效较低。这个F类-当协变量的数量超过样本数量时,测试甚至完全失败。对于广义线性模型中的似然比检验,类似的行为是已知的。一般来说,当用于高维替代品时,经典测试往往表现不佳。

本文探讨了针对高维替代方案的简单零假设的测试。我们将制定一个简单的测试,该测试可以用于高维模型,而不考虑参数的数量。该测试被构造为经验贝叶斯模型中超参数的局部最强大测试(分数测试)。在微阵列基因表达数据的背景下,针对特定模型引入了相同类型的测试,用于将临床变量与单个基因之间的关联测试推广为临床变量与一组基因之间的相关性测试。戈曼. (2004)已经将这种方法应用于具有规范链接函数和Goeman的广义线性模型. (2005)在考克斯比例风险模型中。有关实际数据应用的示例,我们参考这些论文。

在本文中,我们采用纯粹的频率学家观点,更详细地探讨了此类测试的一般功率特性。该检验将被证明在零假设附近具有最佳平均功率,这是Neyman–Pearson引理的必然结果。此属性使测试成为局部最强大测试到更高维度的自然推广,并激励我们将局部最强大的测试的这个高维版本简单地称为局部最强大检测。

我们还将更仔细地研究线性模型中高维替代方案的相对简单情况。在这个模型中,几乎没有令人分心的细节,许多数量可以明确计算。我们研究了参数空间中新测试具有最大和最小功率的区域以及我们可能期望具有良好功率的情况。

在线性模型中,调查与其他测试的联系也相对容易,最显著的是F类-测试。事实证明F类-测试可以公式化为具有不同先验分布的经验贝叶斯模型中的分数测试,这一事实可以深入了解F类-测试。我们还研究了分数测试程序和主成分测试之间的关系,以及微阵列数据分析的典型多重测试程序,该程序使用了所有绝对单变量中的最大值T型-统计量作为全局零假设的检验统计量。所有这些比较都将通过基于真实微阵列数据(取自Van de Vijver)的模拟进行说明. (2002)).

2.经验贝叶斯模型测试

假设我们有观察结果(通常是n个-向量),其分布假定取决于第页-参数向量β。在此模型中,我们要测试

H(H)0:β=0

反对H(H)A类:β0。也可能有一些令人讨厌的参数,但我们假设它们目前已知。

如果尺寸第页在替代假设很大的情况下,替代方案可以覆盖很大的空间,并且H(H)A类通常允许许多不同的一些替代品甚至可能导致相同的作为H(H)0尤其是如果第页>n个。例如,在广义线性模型中取决于β仅通过Xβ,其中X是一个n个×第页设计矩阵。如果第页>n个,有许多替代方案β0但是Xβ=0这些备选方案产生了相同的正如零假设一样,这意味着我们永远不可能有任何力量对抗这些替代方案。这是高维备选方案的典型情况:试图对抗所有备选方案的minimax类型方法注定会失败。

因此,将测试的力量集中在我们选择的最有趣的替代品上似乎是一种明智的方法。这可以通过分配向量以贝叶斯方式完成βa分配。该分布应为被认为更可能(如在先前分布中)或更“有趣”检测的备选方案提供最大概率质量。通过选择β如果可能的话,我们可以针对备选方案空间中的哪个区域指定测试应该具有最大的能力。通过在β我们可以将测试的兴趣集中在一些备选方案上,而对其他方案视而不见。

什么样的分布β应该在很大程度上取决于模型和测试目的。然而,对于这种分布来说,一个好的无偏见的选择通常是“无偏见”的,即它围绕零假设对称,因此具有E类(β)=0这是明智的,因为我们通常对检测以下替代方案同样感兴趣β=β1与检测时一样β=−β1对于每个β1。的协方差矩阵β然后可以选择为

E类(ββ)=τ2Σ

对于一些精心选择的正(半)定第页×第页矩阵∑。选择∑=值得特别关注,因为它遵循一个可交换性假设:向量所有排列的密度β相等(伯纳多和史密斯(1994),第180页)。在这种可互换性假设下,我们对β应为大型或β预计将类似。当参数中没有易于利用的结构或顺序,并且参数值的典型范围相似时,此假设很有用。

我们可以完成β通过为选择值τ2和分布形状。在广义线性模型设置中,取β然后将产生许多常见的惩罚回归方法中的一种,这取决于β.选择β具有独立且相同分布的正态项会导致(广义)岭回归(Hoerl和Kennard,1970)。选择回归系数β在拉索方法中独立且同分布的双指数结果(Tibshirani,1996)。这些方法经常用于高维回归模型中的估计和预测问题。这些方法与本文中描述的测试有着密切的关系(Goeman等人。,2004).

我们使用选定的分布β作为重新表述测试问题的工具,根据.让(f)(β;)可能是β对于给定的.让E类β|τ2(·)表示对所选分布的期望β对于给定的τ2.边缘密度就是那个时候

(f)¯(τ2;)=E类βτ2{(f)(β;)},

这可以解释为τ2在一个新的边际模型中在这个新模型中,拒绝新的零假设H(H)¯0:T型2=0意味着拒绝旧的H(H)0:β=0,因为这两者意味着.

基于测试的测试程序H(H)¯0:T型2=0反对H(H)¯A类:T型2=T型12可以称为“经验贝叶斯测试”,因为我们在参数向量上设置了一个先验值β依赖于未知超参数的模型τ2以及我们对β通过推理进行τ2然而,它也可以简单地称为“贝叶斯测试”,因为,一旦分布的形状和值T型12已经选择,模型H(H)A类完全是贝叶斯的。

测试的一个重要用途H(H)¯0在边际模型中位于引理1中,是内曼-皮尔逊引理的推论。它说,如果我们将β并在边际模型中构造一个似然比检验,得到的检验在所选择的备选方案分布上具有平均最优功率。

引理1(Neyman–Pearson引理的经验Bayes版本)。A类1是似然比检验的关键区域H(H)¯0:T型2=0反对H(H)¯A类:T型2=T型12在边际模型中(f)¯,具有相关的功率功能w个¯T型12(β)=P(P)|β(A类1); 然后让A类是任何测试的关键区域H(H)0:β=0,带电源功能w个(β)=P(P)β(A类)。然后

w个(0)w个τ12(0)

意味着

E类βτ12{w个(β)}E类βτ12{w个τ12(β)}.

这是一个众所周知的结果。当观察到E类β|T型12{w个(β)}=E类β|T型12{P(P)|β(A类)}=P(P)|T型12(A类).

引理1的结果可以立即用于实践,但前提是我们愿意指定β包括T型12相关策略是使用基于最大似然估计的似然比测试T型^2属于τ2。由于两个原因,这两种策略都存在问题。

首先,边际似然是一个复杂的问题第页-维积分,除非在特殊情况下(Jennrich和Schluchter,1986)。这使得很难找到τ2准确,以及找到似然比检验统计量的值,即使对于预先选择的T型12找到结果检验统计量的(渐近)分布同样困难:因为边际似然不是独立项的乘积,所以没有理由期望一个普通的X12-分布为渐近分布。参见混合模型和方差分量文献(例如Kuk(1999)以了解详细信息。

其次,为了能够计算似然比检验统计量,我们必须指定β,至少达到一个参数τ2。这意味着指定感兴趣的备选方案是否具有β有几个大条目或许多小条目。这是一种在高维数据中通常很难做出的判断。例如,在高维回归模型中,通常不知道是大回归系数很少还是小回归系数很多。分配的错误选择β可能意味着功率低。

3.本地最强大的测试

事实证明,我们可以为H(H)¯0在边际模型中,设法避免对β同时避免了复杂的边际似然估计。这可以通过将测试构建为分数测试来完成。

传统的分数测试是一种单边测试H(H)0*:θ=θ0反对H(H)A类*:θ>θ0在一个具有似然的单参数模型中(f)*(θ;)。分数测试统计时拒绝

S公司*()=d日d日θ日志{(f)*(θ0;)}k个

对于一些常量k个.如果θ0位于参数空间的边缘,S公司*()应作为右侧导数。对于测试尺寸的典型值α临界值k个几乎总是为正,因为根据分数函数的性质,S公司*()在零假设下具有零期望。

作为引理2的结果,分数测试被称为“局部最强大的测试”。这个引理表明,在最大相同规模的所有测试中,分数测试具有幂函数的最佳斜率,因此它对接近零假设的局部替代方案具有最佳功效。

引理2(分数测试性质)。假设导数d(f)*(θ;)/天θ几乎处处存在,并且在以下(右)邻域中有界θ0然后,对于H(H)0*具有临界区域A类和功率函数w个(θ)=P(P)θ(A类),导数dw个(θ0)/d日θ存在。此外,如果w个*(θ)=P(P)θ(S公司*k个)是分数测试的幂函数,那么

  • (a)

    w个(θ0)=w个*(θ0)或

  • (b)

    w个(θ0)w个*(θ0)和k个0

意味着

d日d日θw个(θ0)d日d日θw个*(θ0).

引理2的证明在附录A.

Cox和Hinkley对一维局部最强大测试进行了更广泛的处理(1974)。他们表明,分数测试可以解释为θ1θ0的似然比检验H(H)0*反对点替代方案H(H)1*:θ=θ1。当针对“复杂”的替代方案测试“简单”的零假设时,分数测试通常很有用,因为分数测试不需要估计θ我们的高维替代方案就是这样一个复杂替代方案的好例子。

我们将通过测试在经验贝叶斯设置中应用分数测试H(H)¯0:T型2=0反对H(H)¯A类:T型2>0在边际模型中使用分数检验统计量

S公司=d日d日τ2日志{(f)¯(0;)},

它自动成为右侧导数(f)¯仅为定义τ2这个检验有两个非常有用的性质,我们已经将它们表示为引理3和引理4。

第一个属性对于计算和建模都很重要。引理3表示测试统计S公司可以通过简单的矩阵运算从条件似然中找到(f)(β;)和的协方差矩阵β这意味着我们不需要数值积分来找到测试统计值,也不需要指定β.

引理3(分数测试统计)。假设β=τb条,其中E类(b条)=0E类(b条b条)=∑和b条不依赖于τ假设log-likelihood log{(f)(β;)}它的前两个导数几乎处处存在,并且有界于β=0然后是分数测试统计

S公司=d日d日τ2日志{(f)¯(0;)}

存在并由提供

S公司=12Σ12信托收据(Σ)

哪里

=⏴=================================================================β日志{(f)(0;)}

是分数函数

=2ββ日志{(f)(0;)}

观察到的Fisher信息β在里面H(H)0.

引理3的证明是一个简单的计算,它在附录A.

分数测试的第二个也是最重要的属性基于S公司引理4给出了。这也是一个最优性性质,它有效地结合了引理1和2的陈述。引理4表示经验贝叶斯模型中的分数测试,它在边际模型中具有最优的幂函数斜率(f)¯,具有条件模型中幂函数的最佳期望斜率(f)引理4仅适用于带有∑的测试的可交换版本=,尽管也可以制定更通用的版本。

引理4(局部最优功率)。假设引理3的条件与∑保持一致=.让w个¯(β)=P(P)|β(S公司k个)是可交换分数测试的幂函数H(H)0.让w个(β)=P(P)β(A类)是任何测试的幂函数H(H)0。然后是

  • (a)

    w个(0)=w个¯(0)

  • (b)

    w个(0)w个¯(0)k个0

意味着

E类ξ{d日d日τ2w个ξ(0)}E类ξ{d日d日τ2w个¯ξ(0)}

哪里w个ξ(τ)=w个(τξ),w个¯ξ(T型)=w个¯(T型ξ)ξ在装置上分布均匀第页-球(第页=尺寸(β)). ξ在装置上有任何其他分配第页-这样的球E类(ξ)=0E类(ξξ)∝.

引理4的证明在附录A事实上,引理4从引理2派生而来,其方式与引理1从内曼-皮尔逊引理派生而来的方式几乎相同。

通过引理4,我们看到可交换经验贝叶斯模型中的分数测试具有幂函数的最佳期望斜率,其中期望是相对于在第页-空间。这就是它被称为本地最强大测试的原因。这是一个有趣的附带说明,即使第页=1,根据引理3,基于S公司与普通的一维分数测试不同S公司*,因为基于S公司是一个双边测试,而基于S公司*是单面的。通过引理3和4,基于S公司是一维分数测试从单边选项到双边选项的适当推广。

4.滋扰参数

干扰参数使上述一些问题复杂化。当存在干扰参数时,零假设不再简单,而是复合的。在这种情况下,严格最优性在引理4的意义上是不可能的。

干扰参数的问题通常通过切换到剖面可能性来解决(Pawitan,2001)。当干扰参数的数量相对较少时,这是一个很好的策略。当使用分数测试时,切换到剖面似然非常容易:我们可以简单地插入零假设下的干扰参数的最大似然估计。这在一个简单的对数似然双参数模型中很容易看到(θ,η)和剖面可能性^(θ)={θ,η^(θ)}.在这种情况下

^⏴=============================================================================θ=θ+ηηθ.
1

右侧的第二项为0,因为/∂η始终为0 inη^.

通过将分数测试再次视为(剖面)似然比测试,也可以理解这种对妨害参数零估计的简单插入θ=θ0θ=θ1对于θ1θ0.在极限内,最大似然估计η在替代假设下与在原假设下相同。

在本文的经验贝叶斯模型中,情况基本相同。与等式类似的论点(1)可用于检查引理3的证明,即在零假设下插入估计值等同于使用轮廓似然。对于这种推导,从似然开始,我们是否使用条件配置文件似然没有区别(f)和最大似然估计η^(β;)干扰参数的η作为的函数β或者我们是否使用边际似然(f)¯和最大似然估计η¯(T型2;)从给定的边际模型τ2两种剖面可能性导致相同的测试。

参见第节6例如,一个带有干扰参数的模型。

5.测试统计的分布

前几节中本地最强大测试的规范并不是完全完整的,因为它只为我们提供了要使用的测试统计数据。为了能够在实践中使用测试,我们还必须知道在零假设下测试统计量的分布,以便能够找到显著性和/或第页-值。没有找到null分布的通用方法,当要在特定模型的上下文中应用本地最强大测试的概念时,这可能需要一些额外的工作。这里我们只作一些一般性评论。参见第节6和戈曼. (2004,2005)以获取具体示例。

除了在零假设下有零期望外,测试统计S公司尚未标准化,一般来说,不应该遵循任何标准的文本图书分发。通常不容易直接将渐近结果应用于分数统计量的分布,因为边际似然(f)¯分数统计数据的来源通常不是n个个人的贡献。渐进参数可用于特定模型(如Goeman. (2005)),但我们还没有一般理论。

然而,在许多情况下,我们可以找到一个相当好的近似值来近似S公司因为的表达式S公司如引理3所示,这相对容易。平均值和方差S公司通常可以显式计算。这允许通过与列表分布进行矩匹配来近似零分布(此策略在Goeman中使用. (2004)). 查找以下分布的其他实用选项S公司包括数值积分或置换方法。分布函数的精确计算S公司在特殊情况下是可能的,例如用正态误差检验线性模型中的全局零假设,这就是我们现在要讨论的情况。

6.线性模型

引理4中隐含的最优性非常吸引人,但它也有其局限性。良好的功率是有保证的,但仅限于接近零假设的局部,以及许多可能的替代方案的平均功率。为了更深入地研究引理4对于特定的备选方案的价值,我们将详细研究线性模型的最简单情况。

假设∼𝒩(Xβ,σ2),其中X是一个n个×第页满秩min的设计矩阵(n个,第页)。为了简单起见,我们忽略了intercept参数α通常包括(参见Goeman. (2004)如何处理干扰参数α)。该模型的得分向量为=σ−2X并且观察到的Fisher信息是=σ−2XX,所以经验贝叶斯模型中的一般分数测试统计是

S公司~Σ=12σ4XΣX12σ2信托收据(XΣX).

使用等效测试统计量更方便σ−2XΣX,其分布不依赖于σ2.因为σ2未知,我们插入其最大似然估计σ^02'在零假设下。得到的测试统计数据为

S公司Σ=XΣX,
2

其分布也不依赖于干扰参数σ2.我们研究了交换情形∑=,作为本地最强大的测试统计数据

S公司=XX.

要找到的分布函数S公司,我们可以使用以下身份(阿扎里尼和鲍曼,1993):

P(P)(S公司>t吨)=P(P){(XXt吨)>0}.

商的分布函数S公司因此可以通过正态变量中的二次型分布函数找到。我们使用Imhof开发的数值方法(1961)计算后者的分布函数。通过将以下力矩等式,也可以找到与5%和1%截止值相当好的近似值S公司对于伽马分布,这是戈曼使用的一种策略. (2004).

有趣的是注意到测试统计数据之间的联系S公司以及偏最小二乘法,该方法通常用于化学计量学中的高维数据(Brown,1993)。偏最小二乘回归的第一个分量是XX,所以测试统计S公司可以看作是对第一偏最小二乘分量和.

7.分数测试的威力

我们希望深入了解当地最强大的测试在实践中的威力。已经有人说过,当备选方案是高维的时,不可能对所有备选方案都有力量。为了查看哪些选项是我们的分数测试无法检测到的,我们检查哪些选项的预期测试统计值小于零假设下的预期。这些替代品的功率小于α测试结果。

在零假设下,检验统计量S公司有期望

E类0(S公司)=1n个信托收据(XX).

在替代假设下S公司可以通过分别取分子和分母的期望值来很好地近似:

E类β(S公司)βXXXXβ+σ2信托收据(XX)βXXβ+n个σ2.

如果要么被Xβ或通过σ2(即在任何限制中n个→∞,σ20,σ2→∞β0).

期望之间的差异是

E类β(S公司)E类0(S公司)βXXXXβ(1/n个)βXXβ信托收据(XX)βXXβ+n个σ2.

要解释这个表达式,我们必须了解X以及每个主要组成部分都解释了这一点。呼叫

第页2=βXXββXXβ+n个σ2

方差的分数由替代假设解释。我们使用光谱分解。写入

XX==1n个λ,

哪里λ1λn个0是的特征值XX第页×第页投影到特征向量的投影矩阵XX对应于特征值λ。我们可以在n个第个分量,因为的秩XX为最小值(n个,第页)n个频谱分解的使用给出

第页2==1n个第页2,

具有

第页2=λβββXXβ+n个σ2,

E类β(S公司)E类0(S公司)==1n个λ第页21n个=1n个λj个=1n个第页j个2.

这可以被认为与向量的协方差成正比λ=(λ1,…,λn个)主成分方差X和向量第页=(第页12,,第页n个2)',它给出了方差的分数由这些组件解释。

这个小练习有几个有趣的结论。首先,有很多选择,特别是在第页n个这种情况下,本地最强大的测试的威力可以忽略不计。这些是小方差主成分X解释这些无法检测到的替代品可能具有以下任何价值第页2,甚至第页2=1:替代方案E类|β(S公司)E类|0(S公司)和第页2=1的功率甚至为零。

幸运的是,对于分数测试λ第页在实际数据中很少出现,因为X通常是嘈杂或不准确的。非信息性噪声往往在小方差主成分中占主导地位X.

如果一个测试相对于许多替代方案具有如此低的功率,那么它平均来说怎么可能是最强大的?其原因在于作为测试基础的可互换性假设。根据引理4,功率在小第页-球与ββ=c(c)。这个球上的备选方案具有非常多样的价值第页2:具有以下特征的备选方案β在对应于大特征值的特征向量的方向上XX有大的第页2; 其他人有小第页2。很难用很大的力量对抗小的替代品第页2即使是知道方向的“预言家”β并且只测试║β║=如果为true,0将具有低功率β具有低第页2。因此,如果牺牲低电位替代品上的一些功率以换取高电位替代品的功率增益,则平均功率将增加。这是可交换分数测试所做的有利权衡。

如果负协方差λ第页导致E类|β(S公司)<E类|0(S公司)相反,相同的正协方差λ第页导致E类|β(S公司)>E类|0(S公司)以及潜在的良好动力。对于其中一些备选方案,分数测试甚至必须具有很好的能力,因为根据引理4,该测试在本地平均最强大。我们在章节中回到这一点810,其中我们将本地最强大的测试与F类-测试。

检验统计量期望值偏低的问题S公司在替代假设下而不是在零假设下,当n个很大。如果我们允许n个成长为千牛顿通过观察k个每个协变量模式的样本,E类|β(S公司)最终会变得比E类|0(S公司),因为让n个在这种环境中成长意味着增强这两者λ第页使用0s,因此两者之间的相关性增加。同样,如果我们第页<n个首先,至少有n个第页0个元素,共个λ具有对应的0个元素第页,所以λ第页自动重合,几乎没有其他选择E类|β(S公司)E类|0(S公司).

8.全新视角F类-测试

第页<n个可以同时应用本地最强大的测试和F类-测试,这使得比较两者很有趣。这个F类-线性模型中的检验统计量是常数倍

F类~=X(XX)1X(X(XX)1X).

我们发现转换很方便F类~通过严格递增函数(x个)=(x个−1+1)−1等效测试统计F类=(F类~),由给出

F类=X(XX)1X.

在零假设下F类具有带参数的beta分布12第页12(n个第页).

现在很容易比较F类使用本地最强大的测试统计

S公司=XX/.

我们可以立即注意到,如果设计是正交的(即。XX),这两个测试都是等效的。如果第页=1,因此本地最强大的测试第页=1等于F类-测试,从而达到双面t吨-测试。

比较时会有更多的基本见解F类用方程中给出的局部最强检验统计量的一般表达式(2)。作为

S公司Σ=XΣX/,

我们有F类=S公司(XX)−1。因此,我们可以查看F类-基于先验协方差的经验贝叶斯模型中的分数检验E类(ββ)=τ2(XX)−1对于τ2非常小。通过引理1F类-因此,test优化了此分布的平均功率β. TheF类-因此,测试特别针对以下方向的替代方案:β是大的。这些方向是XX这些也是大第页2需要一个很大的║β║. 反之亦然XX收到一个小的先验方差β因此,这些对F类-测试:β先验的预计不会朝着这些方向发展。大特征值的特征向量的方向XX是小规模投资║的方向β结果导致大量第页2.

我们对F类-测试我们是否通过以下方式正交化设计β~=(X'X)1/2βX~=X(X'X)1/2。这将导致Xβ=X~β~为所有人β因此保持不变。F类-测试,局部最强大的测试在参数变化下不是不变的:在交换性假设下E类(β~β~')=T型2β~我们现在获得F类-test作为新参数化的本地最强大的测试。应用第节的推理6对于新的参数化,我们可以看到F类-测试优化了不超过小球的力量ββ=c(c)但在具有β~'β~=β~'X'Xβ=c(c),它们是具有相同备选方案的椭球体第页2.具有相同的所有备选方案第页2具有相同的势能,因此没有权衡,椭球体中的所有备选方案都被赋予同等的权力。备选方案下的预期检验统计量减去零假设下的预期试验统计量F类-测试是

E类β(F类)E类0(F类)=第页2(1第页n个),

这只取决于β通过第页2。无论何时,它都是积极的第页2>0和第页<n个.

本地最强大的测试与F类-因此,测试是这样的,而对于F类-用相同的方法测试所有备选方案第页2分数测试的目的是明确地寻找节俭的替代品,这可以解释最低支出为║β║.

没有简单的分析表达式可以显示第页n个情境F类-测试比分数测试更有力量,反之亦然。然而,令人信服的是,对于那些方差较大的主成分X解释,得分测试具有更大的力量,而对于小方差主成分解释大多数方差的备选方案,的F类-测试更强大。这可以通过书写看到XX年在光谱分解中

XX==1n个λP(P),

哪里P(P)n个×n个投影矩阵第个主成分。然后

S公司==1n个λP(P),

所以测试统计S公司是测试统计的加权和P(P)哪个测试是否主成分与权重与主成分的方差成正比。以同样的方式

F类==1n个P(P);

统计数据F类是相同测试统计数据的未加权总和。比较这两种复合测试,我们可以认为,如果一种测试对最有力的条件施加更重的权重,那么它的威力会比另一种测试大。我们将在第节中通过模拟来说明这一点10.

一种有趣的替代方法,可以预期本地最强大的测试比F类-检验是一种因子分析类型的设置,其中有限数量的潜在变量线性地决定了两个协变量X和结果变量但两者都有误差(巴塞洛缪和诺特,1999)。在这种情况下,潜在变量往往出现在X而非信息性噪声往往支配小方差主成分。这种设置对于许多实际问题来说并非不切实际,尤其是在高维数据中,因为协变量通常被视为对几乎相同的潜在机制的噪声测量。在这种替代方法中,我们通常会应用主成分测试:减少矩阵X它的前几个主要组件,然后应用F类-测试。与主成分测试相比,本地最强大的测试的一个重要优点是无需选择主成分的数量。我们回到第节中的主要组件测试10.

9.稀疏替代方案

在前面的章节中,我们已经确定,本地最强大的测试特别针对具有较小║的节约型替代品β║. 另一种节俭的备选方案是稀疏备选方案,其中只有几个条目β非零。这种替代方法在回归建模中特别有趣。

一项旨在检测回归模型中这种稀疏替代类型的测试是一个多重测试过程。这种测试程序通常用于微阵列数据分析。有许多变体,但最基本的形式如下:for=1,…,第页T型-检验统计量t吨计算以测试每个协变量与结果的关联.测试统计T型~最大值=最大值(|t吨1|,,|t吨第页|)用于测试任何协变量和.临界值T型~最大值可以通过使用Bonferroni平差或使用数值方法保守地找到。

虽然这个测试可能与本地最强大的测试不同,但仍然存在联系。首先,我们可以转换每个|t吨|至(t吨2),使用函数(x个)=(x个−1+1)−1第节中也使用了8,生成带有参数的beta分布的测试统计信息1212(n个1).作为(x个2)在中增加|x个|、测试统计

T型最大值=最大值{(t吨12),,(t吨第页2)}

等于T型~最大值接下来,我们写x个对于第列,共列X; 然后

(t吨2)=x个x个x个x个.

然而,正如我们可以写的那样

XX==1第页x个x个,

我们可以这么说

S公司==1第页x个x个(t吨2),

因此,局部最强大的测试统计量是相同(变换)的加权和t吨-测试统计信息T型最大值是最大值。权重与x个.

也许令人惊讶的是,如果第页较大且非零β-系数很小,根据引理4,平均而言,在所有可能的稀疏替代方案中,分数测试比基于T型最大值,即使只有一个回归系数非零。假设β随机给定一个非零项,大小固定,但带有随机符号βE类(β)=0如果第页很大,E类(ββ)≈τ2对一些人来说τ2.通过引理4,分数测试在平均上对β检测这些替代方案,如果τ2很小。

这种最优性也可以从主成分的角度来理解。如果主成分很少且方差较大,则很可能x个与正回归系数相比,其方差的主要部分也在这些方差较大的主成分方向上。如果与相关x个因此,它自动与这些主成分相关,并因此与许多其他协变量相关x个j个,它们的方差也倾向于在大方差主成分的方向上有很大一部分。因此,单一的回归系数可能导致许多显著的t吨-统计数据。在这种情况下t吨-统计数据超过了最大值。

剖面中的模拟10说明这些要点。

10.模拟

在前几节中提出的许多观点需要进行一些说明。我们将通过在线性模型中使用模拟来实现这一点。模拟基于实际数据,即设计矩阵X是一个真正的生物数据集:基因表达测量的微阵列数据集第页=4911个基因n个=294名乳腺癌患者(取自Van de Vijver. (2002),由于缺失值,删除了一些基因和患者后)。矩阵X已规范化为行和列均为0。归一化后X有等级n个−1,最大非零奇异值与最小非零奇异值之比为26.6。使用此设计矩阵X,的值根据下面选择的模型进行模拟。

首先,我们将本地最强大的测试与F类-测试,以说明第节中的陈述8当大方差主成分X解释。由于我们无法使用F类-测试时间第页>n个,我们减少了矩阵XX*通过只选择作为协变量第页*=52个基因属于凋亡途径。

模拟设置如下。我们写作X*在奇异值分解中

X*=U型Λ1/2V(V),

具有U型一个n个×第页*半正交矩阵,V(V)第页*×第页*正交矩阵与∧a第页*×第页*带对角元素的对角矩阵λ*=(λ1,…,λ第页*),其中每个λ是的方差第个主成分。为了改变主成分解释的方差量,我们选择回归系数为

β=V(V)Λ/21λ

对于的各种值。在此设置中主成分具有回归系数λ/2并解释了一个分数第页2方差的与…成比例λ1+1因此,如果>0,大方差主成分具有更大的回归系数,因此解释了; 如果−1<<0,大方差主成分的回归系数较小,但仍比小方差主成分解释更多的方差,然而,如果<-1,小方差主成分占主导地位.通过改变σ2作为的函数我们可以获得第页2对于每个.

为了估算这些替代方案的功率,我们产生了10000-具有不同值的备选方案中的每个向量第页2.水平截流α对于S公司-统计是通过使用Imhof的精确方法发现的(1961)。结果见表1。它们表明了分数测试和F类-测试可与=12,尽管F类-测试在这里仍然有一点优势。分数测试对于较大的; 这个F类-对于较小的值,测试更强大。这与第节中的理论讨论一致8.

表1

局部最强大测试之间的蒙特卡罗功率比较S公司,的F类-测试和测试P(P)1,仅使用第一个主成分进行测试

备选方案以下值的结果第页2:
第页2=0.02第页2=0.05第页2=0.10第页2=0.15
F类S公司P(P)1F类S公司P(P)1F类S公司P(P)1F类S公司P(P)1
1.50.140.520.520.350.920.900.76110.9611
10.140.460.440.350.880.820.7610.990.9611
0.50.140.360.310.340.790.660.760.990.920.9611
00.130.240.190.340.580.390.750.920.670.960.990.86
−0.50.140.130.100.350.320.180.760.650.310.960.890.43
−10.140.080.060.340.140.080.760.270.100.960.440.13
−1.50.140.060.050.350.070.050.750.100.050.960.130.05
备选方案s以下值的结果第页2:
第页2=0.02第页2=0.05第页2=0.10第页2=0.15
F类S公司P(P)1F类S公司P(P)1F类S公司P(P)1F类S公司P(P)1
1.50.140.520.520.350.920.900.76110.9611
10.140.460.440.350.880.820.7610.990.9611
0.50.140.360.310.340.790.660.760.990.920.9611
00.130.240.190.340.580.390.750.920.670.960.990.86
−0.50.140.130.100.350.320.180.760.650.310.960.890.43
−10.140.080.060.340.140.080.760.270.100.960.440.13
−1.50.140.060.050.350.070.050.750.100.050.960.130.05

测试使用α=0.05. 各种备选方案由其第页2和系数:>0表示方差较大的主成分得到较大的回归系数,反之亦然<0.

表1

局部最强大测试之间的蒙特卡罗功率比较S公司,的F类-测试和测试P(P)1,仅使用第一个主成分进行测试

备选方案以下值的结果第页2:
第页2=0.02第页2=0.05第页2=0.10第页2=0.15
F类S公司P(P)1F类S公司P(P)1F类S公司P(P)1F类S公司P(P)1
1.50.140.520.520.350.920.900.76110.9611
10.140.460.440.350.880.820.7610.990.9611
0.50.140.360.310.340.790.660.760.990.920.9611
00.130.240.190.340.580.390.750.920.670.960.990.86
−0.50.140.130.100.350.320.180.760.650.310.960.890.43
−10.140.080.060.340.140.080.760.270.100.960.440.13
−1.50.140.060.050.350.070.050.750.100.050.960.130.05
备选方案以下值的结果第页2:
第页2=0.02第页2=0.05第页2=0.10第页2=0.15
F类S公司P(P)1F类S公司P(P)1F类S公司P(P)1F类S公司P(P)1
1.50.140.520.520.350.920.900.76110.9611
10.140.460.440.350.880.820.7610.990.9611
0.50.140.360.310.340.790.660.760.990.920.9611
00.130.240.190.340.580.390.750.920.670.960.990.86
−0.50.140.130.100.350.320.180.760.650.310.960.890.43
−10.140.080.060.340.140.080.760.270.100.960.440.13
−1.50.140.060.050.350.070.050.750.100.050.960.130.05

测试使用α=0.05. 各种备选方案由其第页2和一个系数:>0表示方差较大的主成分得到较大的回归系数,反之亦然<0.

将本地最强大的测试与测试进行比较也很有趣P(P)1,这是F类-测试的第一个主成分X*与相关表中也给出了结果1我们可以看到,当地最强大的测试与该测试的能力相当P(P)1对于高值,但对于所有考虑的备选方案来说,它总是更好。

在第二个模拟实验中,我们研究了高维数据中的稀疏替代方案。我们将本地最强大测试的功率与基于T型最大值,最大绝对值t吨-统计,如第节所述9.

为此,我们使用第页=4911个基因。我们制定了备选方案β,j个对于j个=1,…,第页=1,3,10,30,这样每个备选方案β,j个具有回归系数βj个,…,βj个+−1等于1,所有其他值等于0(取β=β第页如果>第页)。2显示了基于S公司T型最大值与备选方案相比,平均而言β,1,…,β,第页具有非零回归系数。在模拟中σ2被认为对所有备选方案都是平等的β,1,…,β,第页并被选中以获得一定的平均值第页2这些替代方案。我们为每个备选方案生成了两个副本,因此每个功率计算都基于2第页≈10000个蒙特卡洛样本.

表2

局部最强大测试之间的蒙特卡罗功率比较S公司和测试T型最大值基于最大值第页绝对的t吨-统计信息使用α=0.05

备选方案m以下值的结果第页2:
第页2=0.01第页2=0.02第页2=0.05第页2=0.10第页2=0.20
S公司T型最大值S公司T型最大值S公司T型最大值S公司T型最大值S公司T型最大值
10.120.100.170.160.330.400.540.740.760.97
0.110.090.170.140.340.320.550.610.800.90
100.110.090.170.140.350.290.580.540.830.84
300.110.090.170.130.340.280.550.510.800.79
备选方案m以下值的结果第页2:
第页2=0.01第页2=0.02第页2=0.05第页2=0.10第页2=0.20
S公司T型最大值S公司T型最大值S公司T型最大值S公司T型最大值S公司T型最大值
10.120.100.170.160.330.400.540.740.760.97
0.110.090.170.140.340.320.550.610.800.90
100.110.090.170.140.350.290.580.540.830.84
300.110.090.170.130.340.280.550.510.800.79

功率值平均超过第页不同的稀疏替代非零回归系数。

表2

局部最强大测试之间的蒙特卡罗功率比较S公司和测试T型最大值基于最大值第页绝对的t吨-统计信息使用α=0.05

备选方案m以下值的结果第页2:
第页2=0.01第页2=0.02第页2=0.05第页2=0.10第页2=0.20
S公司T型最大值S公司T型最大值S公司T型最大值S公司T型最大值S公司T型最大值
10.120.100.170.160.330.400.540.740.760.97
0.110.090.170.140.340.320.550.610.800.90
100.110.090.170.140.350.290.580.540.830.84
300.110.090.170.130.340.280.550.510.800.79
备选方案m以下值的结果第页2:
第页2=0.01第页2=0.02第页2=0.05第页2=0.10第页2=0.20
S公司T型最大值S公司T型最大值S公司T型最大值S公司T型最大值S公司T型最大值
10.120.100.170.160.330.400.540.740.760.97
0.110.090.170.140.340.320.550.610.800.90
100.110.090.170.140.350.290.580.540.830.84
300.110.090.170.130.340.280.550.510.800.79

功率值平均超过第页不同的稀疏替代非零回归系数。

在这个模拟中,一个复杂的因素是缺乏一种简单而准确的方法来寻找统计数据的分布函数T型最大值,因为t吨-统计数据。我们使用模拟来找到α截止日期T型最大值用于设计矩阵X使用20000次模拟,在0.062处发现了0.05截断在零假设下。请注意,这仅略低于Bonferroni原油校正截止值第页贝塔{12,12(n个1)}变量,即0.064。

2确认了第节的理论结果9对于接近零假设的稀疏替代方案,分数测试平均略优于基于T型最大值然而,当单个协变量解释了.考虑到越来越稀疏的替代方案T型最大值-正如可以预料的那样,统计数据失去了影响力,但分数测试实际上保持稳定。Table最令人惊讶的地方是什么2就是说,即使测试的构造方式非常不同,平均功率仍然非常相似。这个T型最大值-统计对非稀疏替代方案的平均能力仍然很强,而局部最强大的测试对远离零假设的稀疏替代方案平均能力很强。

11.讨论

对于针对多维替代方案的测试,没有统一的最强大的测试。测试可能仅对某些备选方案是局部最优的,或对备选方案区域的平均最优。因此,在针对多维备选方案选择测试时,重要的是要考虑所选测试针对哪些备选方案具有良好的功效。在构建这样的测试时,我们可以使用经验贝叶斯模型来设计一个测试,该测试对所选的备选区域平均具有最佳能力。当数据是高维数据时,思考这些问题尤其重要,因为当维数增加时,经常使用的经典测试的威力往往会迅速减弱。

假设检验的经验贝叶斯设计的一个缺点是,构造检验需要对可能高维空间中的复杂分布进行积分。在本文中,我们大体上展示了如何通过分数测试来避免这个问题。该检验具有局部最强的特性:它在零假设的一个定义明确的邻域中具有最佳平均功率。

在线性模型中,我们已经表明,即使在经典的低维情况下,此测试对于许多重要的替代方案也有很好的效果。本地最强大的测试通常比F类-在设计矩阵中变量存在错误的情况下进行测试X,当一小组潜在变量影响X和结果变量,或者更一般地说,当X解释更多的方差而不是小方差的。我们还表明,分数测试在真正高维的情况下具有很好的能力,即使是在稀疏的替代方案中也是如此。如果方差的分数协变量解释为低,该测试甚至优于基于最大绝对值的测试t吨-所有协变量的统计,这是一个旨在寻找稀疏替代品的测试。

随着高维数据越来越普遍,针对高维替代品进行测试的需求也越来越大。本文给出了一般的理论概要,并给出了一个模型的具体例子,在该模型中,试验具有很好的威力。但高维局部最强大的测试在广义线性模型和更一般的模型中都有更多潜在的应用。

参考文献

阿扎利尼
,
答:。
鲍曼
,
答:。
(
1993
)
关于使用非参数回归检验线性关系
.
J.R.统计。Soc.B公司
,
55
,
549
——
557
.

巴塞洛缪
,
D.J.博士。
诺特
,
M。
(
1999
)
潜变量模型与因子分析
,第2版。
伦敦
:
阿诺德
.

贝尔纳多
,
J·M·。
史密斯
,
A.F.M.公司。
(
1994
)
贝叶斯理论
.
奇切斯特
:
威利
.

棕色
,
P.J.公司。
(
1993
)
测量、回归和校准
.
牛津
:
牛津大学出版社
.

考克斯
,
D.R.公司。
欣克利
,
直流电。
(
1974
)
理论统计学
.
博卡拉顿
:
查普曼和霍尔
.

戈曼
,
J·J。
,
范德格尔
,
美国。
,
德科特
,
F、。
范·霍韦林根
,
J.C.公司。
(
2004
)
基因组的全球测试:与临床结果的测试关联
.
生物信息学
,
20
,
93
——
99
.

戈曼
,
J·J。
,
乌斯特
,
J。
,
克莱顿·詹森
,
上午。
,
安宁加
,
J.K。
范·霍韦林根
,
J.C.公司。
(
2005
)
使用基因表达数据测试通路与存活率的关联
.
生物信息学
,
21
,
1950
——
1957
.

霍尔
,
答:E。
犬舍
,
右侧。
(
1970
)
岭回归:非正交问题的有偏估计
.
技术计量学
,
12
,
55
——
67
.

伊姆霍夫
,
J.P.公司。
(
1961
)
正态变量中二次型分布的计算
.
生物特征
,
48
,
419
——
426
.

詹里希
,
钢筋混凝土。
施路克特
,
医学博士。
(
1986
)
具有结构协方差矩阵的非平衡重复测量模型
.
生物计量学
,
42
,
805
——
820
.

库克
,
A.Y.C.公司。
(
1999
)
广义线性混合模型的拉普拉斯重要抽样
.
J.统计。计算机模拟
,
63
,
143
——
158
.

帕维坦人
,
年。
(
2001
)
在所有可能性中:使用可能性的统计建模和推断
.
牛津
:
克拉伦登
.

提比什拉尼
,
R。
(
1996
)
通过套索回归收缩和选择
.
J.R.统计。Soc.B公司
,
58
,
267
——
288
.

范德维杰
,
医学博士。
,
,
Y.D.年。
,
范特维尔
,
洛杉矶。
,
,
H。
,
哈特
,
上午。
,
Voskuil公司
,
D.W.公司。
,
施赖伯
,
G·J。
,
彼得斯
,
J·L·。
,
罗伯茨
,
C、。
,
马顿
,
医学博士。
,
帕里什
,
M。
,
Atsma公司
,
D。
,
维特芬
,
答:。
,
玻璃
,
答:。
,
德拉哈耶
,
L。
,
范德维尔德
,
T。
,
巴特林克
,
H。
,
罗德胡斯
,
美国。
,
罗格斯大学
,
E.T.公司。
,
朋友
,
S.H.公司。
伯纳兹
,
R。
(
2002
)
基因表达特征作为乳腺癌生存预测因子
.
新英语。医学杂志。
,
347
,
1999
——
2009
.

附录A:引理的证明

A.1、。引理2的证明

为了证明引理2,我们必须采用稍微正式一些的符号。使用速记(f)对于密度然后让μ成为一种支配性的手段,这样我们才能写作

P(P)θ(A类)=A类(f)θd日μ.

此外,让1{·}表示指示函数。

为了证明存在,我们写w个(θ)=∫A类(f)d日μ,所以根据支配收敛定理

d日d日θw个(θ0)=A类d日d日θ(f)θ0 d日μ<.

此外,注意d(f)θ0/天θ=S公司*(f)θ0、和使用1A类1B类=1A类B类1B类A类我们可以计算两次

d日d日θw个(θ0)d日d日θw个*(θ0)=A类d日d日θ(f)θ0 d日μS公司*k个d日d日θ(f)θ0 d日μ=A类,S公司*<k个S公司*(f)θ0 d日μA类c(c),S公司*k个S公司*(f)θ0 d日μk个A类,S公司*<k个(f)θ0 d日μk个A类c(c),S公司*k个(f)θ0 d日μ=k个A类(f)θ0 d日μk个S公司*k个(f)θ0 d日μ=k个{w个(θ0)w个*(θ0)}.

只要引理2的条件(a)或(b)成立,最后一项至多为0。

A.2、。引理3的证明

有界导数的假设与以下假设相结合:b条是免费的τ允许我们在以下计算中交换极限和积分。为了简单起见,我们抑制了对在符号中。

S公司=τ20[d日E类b条{(f)(τb条)}/d日τ2E类b条{(f)(τb条)}]   =τ20[E类b条{d日(f)(τb条)/d日τ2}E类b条{(f)(τb条)}]   =τ20[E类b条{((f)(τb条)/β)b条}2τE类b条{(f)(τb条)}].

极限值为0/0,因此我们使用l'Hópital规则来获得

S公司=τ20[E类b条[b条{2(f)(τb条)/ββ}b条]2E类b条{(f)(τb条)}+2τd日E类b条{(f)(τb条)}/d日τ2]  =E类b条[b条{⏴=======================================================================================================2(f)(0)/ββ}b条]2E类b条{(f)(0)}.

现在只剩下重写了

2(f)(0)ββ=(f)(0)().

答3。引理4的证明

假设w个(0)=w个¯(0).通过引理3β具有E类(β)=0和E类(ββ)∝τ2导致相同的测试统计,因此得到相同的幂函数。因此,在不失一般性的情况下,我们可以假设w个¯是经验贝叶斯模型中分数测试的幂函数,其中β作为分发τξ.根据引理2,我们得到

d日d日τ2E类βτ2{w个(β)}d日d日τ2E类βτ2{w个¯(β)}

在里面τ2=0.引理3的有界性假设允许互换微分和积分,因此我们得到

d日d日τ2E类βτ2{w个(β)}=d日d日τ2E类ξ{w个(τξ)}=E类ξ{d日d日τ2w个(τξ)},

两者都适用w个和用于w个¯,结果如下。