针对高维替代方案的测试

局部最强大测试之间的蒙特卡罗功率比较S公司，的F类-测试和测试P（P）₁，仅使用第一个主成分进行测试†

备选方案	以下值的结果第页²:
	第页²=0.02			第页²=0.05			第页²=0.10			第页²=0.15
	F类	S公司	P（P）₁	F类	S公司	P（P）₁	F类	S公司	P（P）₁	F类	S公司	P（P）₁
1.5	0.14	0.52	0.52	0.35	0.92	0.90	0.76	1	1	0.96	1	1
1	0.14	0.46	0.44	0.35	0.88	0.82	0.76	1	0.99	0.96	1	1
0.5	0.14	0.36	0.31	0.34	0.79	0.66	0.76	0.99	0.92	0.96	1	1
0	0.13	0.24	0.19	0.34	0.58	0.39	0.75	0.92	0.67	0.96	0.99	0.86
−0.5	0.14	0.13	0.10	0.35	0.32	0.18	0.76	0.65	0.31	0.96	0.89	0.43
−1	0.14	0.08	0.06	0.34	0.14	0.08	0.76	0.27	0.10	0.96	0.44	0.13
−1.5	0.14	0.06	0.05	0.35	0.07	0.05	0.75	0.10	0.05	0.96	0.13	0.05

备选方案s	以下值的结果第页²:
	第页²=0.02			第页²=0.05			第页²=0.10			第页²=0.15
	F类	S公司	P（P）₁	F类	S公司	P（P）₁	F类	S公司	P（P）₁	F类	S公司	P（P）₁
1.5	0.14	0.52	0.52	0.35	0.92	0.90	0.76	1	1	0.96	1	1
1	0.14	0.46	0.44	0.35	0.88	0.82	0.76	1	0.99	0.96	1	1
0.5	0.14	0.36	0.31	0.34	0.79	0.66	0.76	0.99	0.92	0.96	1	1
0	0.13	0.24	0.19	0.34	0.58	0.39	0.75	0.92	0.67	0.96	0.99	0.86
−0.5	0.14	0.13	0.10	0.35	0.32	0.18	0.76	0.65	0.31	0.96	0.89	0.43
−1	0.14	0.08	0.06	0.34	0.14	0.08	0.76	0.27	0.10	0.96	0.44	0.13
−1.5	0.14	0.06	0.05	0.35	0.07	0.05	0.75	0.10	0.05	0.96	0.13	0.05

†

测试使用α=0.05. 各种备选方案由其第页²和系数秒:秒>0表示方差较大的主成分得到较大的回归系数，反之亦然秒<0.

表1

局部最强大测试之间的蒙特卡罗功率比较S公司，的F类-测试和测试P（P）₁，仅使用第一个主成分进行测试†

备选方案	以下值的结果第页²:
	第页²=0.02			第页²=0.05			第页²=0.10			第页²=0.15
	F类	S公司	P（P）₁	F类	S公司	P（P）₁	F类	S公司	P（P）₁	F类	S公司	P（P）₁
1.5	0.14	0.52	0.52	0.35	0.92	0.90	0.76	1	1	0.96	1	1
1	0.14	0.46	0.44	0.35	0.88	0.82	0.76	1	0.99	0.96	1	1
0.5	0.14	0.36	0.31	0.34	0.79	0.66	0.76	0.99	0.92	0.96	1	1
0	0.13	0.24	0.19	0.34	0.58	0.39	0.75	0.92	0.67	0.96	0.99	0.86
−0.5	0.14	0.13	0.10	0.35	0.32	0.18	0.76	0.65	0.31	0.96	0.89	0.43
−1	0.14	0.08	0.06	0.34	0.14	0.08	0.76	0.27	0.10	0.96	0.44	0.13
−1.5	0.14	0.06	0.05	0.35	0.07	0.05	0.75	0.10	0.05	0.96	0.13	0.05

备选方案	以下值的结果第页²:
	第页²=0.02			第页²=0.05			第页²=0.10			第页²=0.15
	F类	S公司	P（P）₁	F类	S公司	P（P）₁	F类	S公司	P（P）₁	F类	S公司	P（P）₁
1.5	0.14	0.52	0.52	0.35	0.92	0.90	0.76	1	1	0.96	1	1
1	0.14	0.46	0.44	0.35	0.88	0.82	0.76	1	0.99	0.96	1	1
0.5	0.14	0.36	0.31	0.34	0.79	0.66	0.76	0.99	0.92	0.96	1	1
0	0.13	0.24	0.19	0.34	0.58	0.39	0.75	0.92	0.67	0.96	0.99	0.86
−0.5	0.14	0.13	0.10	0.35	0.32	0.18	0.76	0.65	0.31	0.96	0.89	0.43
−1	0.14	0.08	0.06	0.34	0.14	0.08	0.76	0.27	0.10	0.96	0.44	0.13
−1.5	0.14	0.06	0.05	0.35	0.07	0.05	0.75	0.10	0.05	0.96	0.13	0.05

†

测试使用α=0.05. 各种备选方案由其第页²和一个系数秒:秒>0表示方差较大的主成分得到较大的回归系数，反之亦然秒<0.

将本地最强大的测试与测试进行比较也很有趣P（P）₁，这是F类-测试的第一个主成分X^*与相关年表中也给出了结果1我们可以看到，当地最强大的测试与该测试的能力相当P（P）₁对于高值秒，但对于所有考虑的备选方案来说，它总是更好。

在第二个模拟实验中，我们研究了高维数据中的稀疏替代方案。我们将本地最强大测试的功率与基于T型_最大值，最大绝对值t吨-统计，如第节所述9.

为此，我们使用第页=4911个基因。我们制定了备选方案β_米,j个对于j个=1,…,第页和米=1,3,10,30，这样每个备选方案β_米,j个具有米回归系数β_j个,…,β_j个+米−1等于1，所有其他值等于0（取β_我=β_我−第页如果我>第页)。表2显示了基于S公司和T型_最大值与备选方案相比，平均而言β_米,1,…,β_米,第页具有米非零回归系数。在模拟中σ²被认为对所有备选方案都是平等的β_米,1,…,β_米,第页并被选中以获得一定的平均值第页²这些替代方案。我们为每个备选方案生成了两个副本，因此每个功率计算都基于2第页≈10000个蒙特卡洛样本年.

表2

局部最强大测试之间的蒙特卡罗功率比较S公司和测试T型_最大值基于最大值第页绝对的t吨-统计信息使用α=0.05†

备选方案m	以下值的结果第页²:
	第页²=0.01		第页²=0.02		第页²=0.05		第页²=0.10		第页²=0.20
	S公司	T型_最大值	S公司	T型_最大值	S公司	T型_最大值	S公司	T型_最大值	S公司	T型_最大值
1	0.12	0.10	0.17	0.16	0.33	0.40	0.54	0.74	0.76	0.97
三	0.11	0.09	0.17	0.14	0.34	0.32	0.55	0.61	0.80	0.90
10	0.11	0.09	0.17	0.14	0.35	0.29	0.58	0.54	0.83	0.84
30	0.11	0.09	0.17	0.13	0.34	0.28	0.55	0.51	0.80	0.79

备选方案m	以下值的结果第页²:
	第页²=0.01		第页²=0.02		第页²=0.05		第页²=0.10		第页²=0.20
	S公司	T型_最大值	S公司	T型_最大值	S公司	T型_最大值	S公司	T型_最大值	S公司	T型_最大值
1	0.12	0.10	0.17	0.16	0.33	0.40	0.54	0.74	0.76	0.97
三	0.11	0.09	0.17	0.14	0.34	0.32	0.55	0.61	0.80	0.90
10	0.11	0.09	0.17	0.14	0.35	0.29	0.58	0.54	0.83	0.84
30	0.11	0.09	0.17	0.13	0.34	0.28	0.55	0.51	0.80	0.79

†

功率值平均超过第页不同的稀疏替代米非零回归系数。

表2

局部最强大测试之间的蒙特卡罗功率比较S公司和测试T型_最大值基于最大值第页绝对的t吨-统计信息使用α=0.05†

备选方案m	以下值的结果第页²:
	第页²=0.01		第页²=0.02		第页²=0.05		第页²=0.10		第页²=0.20
	S公司	T型_最大值	S公司	T型_最大值	S公司	T型_最大值	S公司	T型_最大值	S公司	T型_最大值
1	0.12	0.10	0.17	0.16	0.33	0.40	0.54	0.74	0.76	0.97
三	0.11	0.09	0.17	0.14	0.34	0.32	0.55	0.61	0.80	0.90
10	0.11	0.09	0.17	0.14	0.35	0.29	0.58	0.54	0.83	0.84
30	0.11	0.09	0.17	0.13	0.34	0.28	0.55	0.51	0.80	0.79

备选方案m	以下值的结果第页²:
	第页²=0.01		第页²=0.02		第页²=0.05		第页²=0.10		第页²=0.20
	S公司	T型_最大值	S公司	T型_最大值	S公司	T型_最大值	S公司	T型_最大值	S公司	T型_最大值
1	0.12	0.10	0.17	0.16	0.33	0.40	0.54	0.74	0.76	0.97
三	0.11	0.09	0.17	0.14	0.34	0.32	0.55	0.61	0.80	0.90
10	0.11	0.09	0.17	0.14	0.35	0.29	0.58	0.54	0.83	0.84
30	0.11	0.09	0.17	0.13	0.34	0.28	0.55	0.51	0.80	0.79

†

功率值平均超过第页不同的稀疏替代米非零回归系数。

在这个模拟中，一个复杂的因素是缺乏一种简单而准确的方法来寻找统计数据的分布函数T型_最大值，因为t吨-统计数据。我们使用模拟来找到α截止日期T型_最大值用于设计矩阵X使用20000次模拟，在0.062处发现了0.05截断年在零假设下。请注意，这仅略低于Bonferroni原油校正截止值第页贝塔 ${\frac{1}{2}, \frac{1}{2} (n个 - 1)}$ 变量，即0.064。

表2确认了第节的理论结果9对于接近零假设的稀疏替代方案，分数测试平均略优于基于T型_最大值然而，当单个协变量解释了年.考虑到越来越稀疏的替代方案T型_最大值-正如可以预料的那样，统计数据失去了影响力，但分数测试实际上保持稳定。Table最令人惊讶的地方是什么2就是说，即使测试的构造方式非常不同，平均功率仍然非常相似。这个T型_最大值-统计对非稀疏替代方案的平均能力仍然很强，而局部最强大的测试对远离零假设的稀疏替代方案平均能力很强。

11.讨论

对于针对多维替代方案的测试，没有统一的最强大的测试。测试可能仅对某些备选方案是局部最优的，或对备选方案区域的平均最优。因此，在针对多维备选方案选择测试时，重要的是要考虑所选测试针对哪些备选方案具有良好的功效。在构建这样的测试时，我们可以使用经验贝叶斯模型来设计一个测试，该测试对所选的备选区域平均具有最佳能力。当数据是高维数据时，思考这些问题尤其重要，因为当维数增加时，经常使用的经典测试的威力往往会迅速减弱。

假设检验的经验贝叶斯设计的一个缺点是，构造检验需要对可能高维空间中的复杂分布进行积分。在本文中，我们大体上展示了如何通过分数测试来避免这个问题。该检验具有局部最强的特性：它在零假设的一个定义明确的邻域中具有最佳平均功率。

在线性模型中，我们已经表明，即使在经典的低维情况下，此测试对于许多重要的替代方案也有很好的效果。本地最强大的测试通常比F类-在设计矩阵中变量存在错误的情况下进行测试X，当一小组潜在变量影响X和结果变量年，或者更一般地说，当X解释更多的方差年而不是小方差的。我们还表明，分数测试在真正高维的情况下具有很好的能力，即使是在稀疏的替代方案中也是如此。如果方差的分数年协变量解释为低，该测试甚至优于基于最大绝对值的测试t吨-所有协变量的统计，这是一个旨在寻找稀疏替代品的测试。

随着高维数据越来越普遍，针对高维替代品进行测试的需求也越来越大。本文给出了一般的理论概要，并给出了一个模型的具体例子，在该模型中，试验具有很好的威力。但高维局部最强大的测试在广义线性模型和更一般的模型中都有更多潜在的应用。

参考文献

阿扎利尼

,

答：。

和

鲍曼

,

答：。

(

1993

)

关于使用非参数回归检验线性关系

.

J.R.统计。Soc.B公司

,

55

,

549

——

557

.

OpenURL占位符文本

巴塞洛缪

,

D.J.博士。

和

诺特

,

M。

(

1999

)

潜变量模型与因子分析

，第2版。

伦敦

:

阿诺德

.

贝尔纳多

,

J·M·。

和

史密斯

,

A.F.M.公司。

(

1994

)

贝叶斯理论

.

奇切斯特

:

威利

.

棕色

,

P.J.公司。

(

1993

)

测量、回归和校准

.

牛津

:

牛津大学出版社

.

考克斯

,

D.R.公司。

和

欣克利

,

直流电。

(

1974

)

理论统计学

.

博卡拉顿

:

查普曼和霍尔

.

戈曼

,

J·J。

,

范德格尔

,

美国。

,

德科特

,

F、。

和

范·霍韦林根

,

J.C.公司。

(

2004

)

基因组的全球测试：与临床结果的测试关联

.

生物信息学

,

20

,

93

——

99

.

戈曼

,

J·J。

,

乌斯特

,

J。

,

克莱顿·詹森

,

上午。

,

安宁加

,

J.K。

和

范·霍韦林根

,

J.C.公司。

(

2005

)

使用基因表达数据测试通路与存活率的关联

.

生物信息学

,

21

,

1950

——

1957

.

霍尔

,

答：E。

和

犬舍

,

右侧。

(

1970

)

岭回归：非正交问题的有偏估计

.

技术计量学

,

12

,

55

——

67

.

伊姆霍夫

,

J.P.公司。

(

1961

)

正态变量中二次型分布的计算

.

生物特征

,

48

,

419

——

426

.

詹里希

,

钢筋混凝土。

和

施路克特

,

医学博士。

(

1986

)

具有结构协方差矩阵的非平衡重复测量模型

.

生物计量学

,

42

,

805

——

820

.

库克

,

A.Y.C.公司。

(

1999

)

广义线性混合模型的拉普拉斯重要抽样

.

J.统计。计算机模拟

,

63

,

143

——

158

.

帕维坦人

,

年。

(

2001

)

在所有可能性中：使用可能性的统计建模和推断

.

牛津

:

克拉伦登

.

提比什拉尼

,

R。

(

1996

)

通过套索回归收缩和选择

.

J.R.统计。Soc.B公司

,

58

,

267

——

288

.

OpenURL占位符文本

范德维杰

,

医学博士。

,

他

,

Y.D.年。

,

范特维尔

,

洛杉矶。

,

戴

,

H。

,

哈特

,

上午。

,

Voskuil公司

,

D.W.公司。

,

施赖伯

,

G·J。

,

彼得斯

,

J·L·。

,

罗伯茨

,

C、。

,

马顿

,

医学博士。

,

帕里什

,

M。

,

Atsma公司

,

D。

,

维特芬

,

答：。

,

玻璃

,

答：。

,

德拉哈耶

,

L。

,

范德维尔德

,

T。

,

巴特林克

,

H。

,

罗德胡斯

,

美国。

,

罗格斯大学

,

E.T.公司。

,

朋友

,

S.H.公司。

和

伯纳兹

,

R。

(

2002

)

基因表达特征作为乳腺癌生存预测因子

.

新英语。医学杂志。

,

347

,

1999

——

2009

.