×

与多重假设检验相关的水平超越的强近似。 (英语) 兹比尔1323.62049

小结:特别是在基因组学领域,但在其他领域,基于相对较小的样本量进行高度多重的Student’s(t)-测试已变得司空见惯。关于这一主题的文献不断扩大,但用于控制家族错误率和错误发现率的主要方法仍然基于测试是独立的假设。已知独立性条件在检验统计量的联合分布水平上是错误的,但这并不一定意味着,对于高度多重假设检验中涉及的小显著性水平,该假设会导致重大错误。本文给出了独立性假设成立的条件。具体地说,我们导出了一个强大的近似值,它将相关“学习化过程”的超越水平与独立随机变量过程的超越水平紧密联系在一起。通过这种联系,可以看出,在高维、低样本量的情况下,如果样本量的偏离速度快于测试次数的对数,则独立测试的假设通常是合理的。

MSC公司:

62H15型 多元分析中的假设检验
62G10型 非参数假设检验
62H20个 关联度量(相关性、典型相关性等)
60层10 大偏差
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Almirantis,Y.和Provata,A.(1999)。基因组组织中的长期和短期相关性。J.统计。物理学。97 233-262. ·Zbl 0940.92019号 ·doi:10.1023/A:1004671119400
[2] Amaratunga,D.和Cabrera,J.(2004)。DNA微阵列和蛋白质阵列数据的探索与分析。纽约:Wiley·Zbl 1040.62096号
[3] Benjamini,Y.和Hochberg,Y.(1995年)。控制错误发现率:一种实用且强大的多重测试方法。J.罗伊。统计师。Soc.序列号。乙57 289-300·Zbl 0809.62014号
[4] Benjamini,Y.和Yekutieli,D.(2001年)。依赖下多重测试中错误发现率的控制。安。统计师。29 1165-1188. ·Zbl 1041.62061号 ·doi:10.1214/aos/1013699998
[5] Benjamini,Y.和Yekutieli,D.(2005)。错误发现率-为选定参数调整了多个置信区间(含讨论)。J.Amer。统计师。协会100 71-93·Zbl 1117.62302号 ·doi:10.19198/0162114504000001907
[6] Bernhard,G.、Klein,M.和Hommel,G.(2004年)。使用有序p值的全局和多个测试程序-综述。统计师。文件45 1-14·Zbl 1085.62017号 ·doi:10.1007/BF02778266
[7] 布莱尔,R.C.、特伦德尔,J.F.和贝克,R.W.(1996)。通过逐步排列测试控制多终点评估中的家庭错误。统计师。医学15 1107-1121。
[8] Clarke,S.和Hall,P.(2009年)。针对依赖性的多个测试程序的稳健性。安。统计师。37 332-358. ·Zbl 1155.62031号 ·doi:10.1214/07-AOS557
[9] Cui,X.和Churchill,G.A.(2003年)。cDNA微阵列实验中差异表达的统计检验。基因组生物学。4 210(电子版)。
[10] Dudoit,S.、Shaffer,J.P.和Boldrick,J.C.(2003年)。微阵列实验中的多重假设检验。统计师。科学。18 73-103. ·Zbl 1048.62099号 ·数字对象标识代码:10.1214/ss/1056397487
[11] Efron,B.(2007a)。大小、功耗和错误发现率。安。统计师。35 1351-1377. ·Zbl 1123.62008年 ·doi:10.1214/009053606000001460
[12] Efron,B.(2007b)。相关性和大规模同时显著性检验。J.Amer。统计师。协会102 93-103·Zbl 1284.62340号 ·doi:10.1198/0162145000001211
[13] Efron,B.和Tibshirani,R.(2002年)。微阵列的经验贝叶斯方法和错误发现率。遗传流行病学。23 70-86.
[14] Falk,M.和Reiss,R.-D.(2001年)。一类二元峰超阈值模型中典型相关参数的估计。统计师。普罗巴伯。莱特。52 233-242. ·兹比尔0981.62018 ·doi:10.1016/S0167-7152(00)00194-2
[15] Fox,R.J.和Dimmic,M.W.(2006年)。微阵列数据的两样本贝叶斯t检验。BMC生物信息学7 126(电子版)。
[16] Hochberg,Y.(1988)。用于多个重要测试的更清晰的Bonferroni程序。生物特征75 800-802·Zbl 0661.62067号 ·doi:10.1093/biomet/75.4.800
[17] Hochberg,Y.和Benjamini,Y.(1990年)。用于多重测试的更强大的程序。统计师。医学9 811-818。
[18] Hochberg,Y.和Tamhane,A.C.(1987年)。多重比较程序。纽约:Wiley·Zbl 0731.62125号
[19] Holland,B.和Cheung,S.H.(2002年)。多比较程序的家族稳健性标准。J.罗伊。统计师。Soc.序列号。乙64 63-77·Zbl 1015.62075号 ·doi:10.1111/1467-9868.00325
[20] Hommel,G.(1988)。两种改进的Bonferroni程序的比较。生物特征76 624-625·Zbl 0676.62028号 ·doi:10.1093/biomet/76.3.624
[21] Hu,Z.和Willsky,G.R.(2006)。利用冗余探针集的两个样本T检验统计数据评估基因芯片研究中的不同探针集算法。BMC生物信息学7 12(电子版)。
[22] Lehmann,E.L.和Romano,J.P.(2005年)。《检验统计假设》,第三版,纽约:施普林格出版社·2018年6月17日
[23] Lehmann,E.L.、Romano,J.P.和Shaffer,J.P..(2005年)。关于降压和升压多重试验程序的最佳性。安。统计师。33 1084-1108. ·Zbl 1072.62060号 ·doi:10.1214/009053605000000084
[24] Li,J.(2006年)。用copula建模不同业务线之间的依赖关系。研究论文146,墨尔本大学经济系精算研究中心。
[25] Liu,P.和Hwang,J.T.G.(2007年)。快速计算样本量,同时控制错误发现率,应用于微阵列分析。生物信息学23 739-746。
[26] Mansilla,R.、De Castillo,N.、Govezensky,T.、Miramontes,P.、José,M.和Coho,G.(2004)。整个人类基因组中的长程相关性。可从获取。
[27] Messer,P.W.和Arndt,P.F.(2006)。CorGen——测量和生成DNA序列分析的长程相关性。核酸研究34 W692-W695。
[28] Pawluk-Kolc,M.、Zieba-Palus,J.和Parczewski,A.(2006)。错误发现率程序在玻璃碎片折射率成对比较中的应用。法医学。国际。160 53-58.
[29] Perneger,T.V.(1998年)。Bonferroni调整有什么问题。BMJ 316 1236-1238。
[30] Pigeot,I.(2000年)。多项测试的基本概念-调查。统计师。论文41 3-36·Zbl 0976.62002号 ·doi:10.1007/BF02925674
[31] 邱,X.和雅科夫列夫,A.(2006)。关于错误发现率估计不稳定性的一些评论。J.生物信息。计算。生物学4 1057-1068。
[32] Sarkar,S.K.(1998年)。有序MTP2随机变量的一些概率不等式:Simes猜想的证明。安。统计师。26 494-504. ·Zbl 0929.62065号 ·doi:10.1214/aos/1028144846
[33] Sarkar,S.K.(2002)。关于逐步多重测试过程中错误发现率的一些结果。安。统计师。30 239-257. ·Zbl 1101.62349号 ·doi:10.1214/aos/1015362192
[34] Sarkar,S.K.和Chang,C.K.(1997年)。具有正相关检验统计量的多重假设检验的Simes方法。J.Amer。统计师。协会92 1601-1608·兹比尔0912.62079 ·doi:10.2307/2965431
[35] Scheid,S.和Spang,R.(2005年)。暮光;用于估计局部错误发现率的Bioconductor包。生物信息学21 2921-2922。
[36] Schmidt,R.(2002)。椭圆轮廓分布的尾部相关性。数学。方法操作。第55号决议301-327·Zbl 1015.62052号 ·doi:10.1007/s001860200191
[37] Schmidt,R.和Stadtmüller,U.(2006年)。尾部相关性的非参数估计。扫描。J.统计。33 307-335. ·Zbl 1124.62016年 ·数字对象标识代码:10.1111/j.1467-9469.2005.00483.x
[38] Schmidt,T.(2007)。处理连接词。《Copulas-从理论到金融应用》(J.Rank主编)。风险账簿。
[39] Sen,P.K.(1999)。关于Simes型多重显著性检验的一些备注。J.统计。计划。推论82 139-145·Zbl 1063.62560号 ·doi:10.1016/S0378-3758(99)00037-3
[40] Shaffer,J.P.(2005)。Y.Benjamini和D.Yekutieli对“错误发现率调整的选定参数的多重置信区间”进行了评论。J.Amer。统计师。协会100 82-84·Zbl 1117.62302号 ·doi:10.1198/0162145000001907
[41] 邵庆明(1999)。学生t统计量的Cramér型大偏差结果。J.理论。普罗巴伯。12 385-398. ·Zbl 0927.60045号 ·doi:10.1023/A:1021626127372
[42] Simes,R.J.(1986年)。一种改进的Bonferroni程序,用于多项显著性测试。生物计量学73 751-754·兹比尔0613.62067 ·doi:10.1093/biomet/73.3.751
[43] van de Wiel,M.A.和Kim,K.I.(2007年)。使用非参数反褶积估计错误发现率。生物统计学63 806-815·Zbl 1146.62102号 ·doi:10.1111/j.1541-0420.2006.00736.x
[44] 王琦(2005)。自归一化大偏差的极限定理。电子J.Probab。10 1260-1285. ·Zbl 1112.60020号
[45] Wang,Q.和Hall,P.(2009)。Student t统计量中心极限定理的相对误差及其应用。统计师。Sinica中国19 343-354·Zbl 1153.62014年
[46] Wu,G.(1994)。序数独立性的实证检验。J.风险和不确定性9 39-60。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。