×

基于交叉验证的真实零假设比例估计。 (英语) Zbl 1204.62127号

摘要:在多重测试环境中,一个具有挑战性的问题是真零假设的比例估计。这一数量的大量估计依赖于可识别性假设,这些假设要么在实际数据中似乎被违背,要么至少可以放宽。所提出的估计量(hat{\pi}_{0})是由直方图密度估计和交叉验证得到的。在独立性下得到了几个一致性结果。基于Y.本杰米尼Y.霍克伯格程序(BH-程序)[J.R.Stat.Soc.,Ser.B 57,No.1,289-300(1995;Zbl 0809.62014号)]以及所提出的估计量。该过程是渐近最优的,提供了渐近期望的错误发现率(FDR)控制,并且比BH过程更强大。最后通过几个模拟实验评估了(hat{\pi}_{0})的非渐近行为。在通常情况下,它优于许多现有的估计器,并且在其他估计器通常失败的“U形”密度下保持准确。它对依赖性没有表现出任何强烈的敏感性。对于\(m\)块结构的依赖数据,当使用\(m/50\)块时,它在块内相关性\(\rho=0.5\)之前保持可靠。

MSC公司:

62J15型 配对和多重比较;多次测试
62G07年 密度估算
6220国集团 非参数推理的渐近性质
65C60个 统计中的计算问题(MSC2010)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Arlot,S.,Celisse,A.,2010年。模型选择的交叉验证程序调查。统计调查4,40-79,doi:10.1214/09-SS054;Arlot,S.,Celisse,A.,2010年。模型选择的交叉验证程序调查。统计调查4,40-79,doi:10.1214/09-SS054·Zbl 1190.62080号
[2] 巴伦,A。;Birgé,L。;Massart,P.,通过惩罚选择模型的风险边界,Probab。理论相关领域,113301-413(1999)·Zbl 0946.62036号
[3] Y.本杰米尼。;Hochberg,Y.,《控制错误发现率:一种实用且强大的多重测试方法》,J.Roy。统计师。Soc.序列号。B、 57、1、289-300(1995)·Zbl 0809.62014号
[4] Y.本杰米尼。;Krieger,A.M。;Yekutieli,D.,控制错误发现率的自适应线性加速程序,Biometrika,93,3,491-507(2006)·Zbl 1108.62069号
[5] Y.本杰米尼。;Yekutieli,D.,依赖下多重测试中错误发现率的控制,Ann.Statist。,29, 4, 1165-1188 (2001) ·Zbl 1041.62061号
[6] Broberg,P.,《未改变基因比例估计值和错误发现率的比较综述》,BMC生物信息学,6199(2005)
[7] 塞利斯,A。;Robin,S.,通过精确的退出交叉验证进行非参数密度估计,计算。统计师。数据分析。(2007) ·Zbl 1452.62264号
[8] Dudoit,S。;Popper Shaffer,J。;Boldrick,J.C.,微阵列实验中的多重假设检验,统计学。科学。,18, 1, 71-103 (2003) ·兹比尔1048.62099
[9] Efron,B.,《大尺度同时假设检验:无效假设的选择》,J.Amer。统计师。协会,99,465,96-104(2004)·Zbl 1089.62502号
[10] 埃夫隆,B。;Tibshirani,R。;Storey,J.D。;Tusher,V.,微阵列实验的经验贝叶斯分析,J.Amer。统计师。协会,96,456,1151-1160(2001)·Zbl 1073.62511号
[11] Genovese,C。;Wasserman,L.,错误发现控制的随机过程方法,Ann.Statist。,32, 3, 1035-1061 (2004) ·Zbl 1092.62065号
[12] Hastie,T.、Tibshirani,R.、Friedman,J.,2001年。统计学习的要素。斯普林格统计学系列。;Hastie,T.、Tibshirani,R.、Friedman,J.,2001年。统计学习的要素。Springer统计学系列,Springer·Zbl 0973.62007号
[13] Langaas,M。;Lindqvist,B.H。;Ferkingstad,E.,估算真零假设的比例,并应用于DNA微阵列数据,J.Roy。统计师。Soc.序列号。B、 67、4、555-572(2005)·Zbl 1095.62037号
[14] Lebarbier,E.,通过模型选择检测高斯过程均值中的多个变化点,信号处理。,85, 717-736 (2005) ·Zbl 1148.94403号
[15] 磅,S。;Cheng,C.,错误发现率的稳健估计,生物信息学,22,161979-1987(2006)
[16] Rudemo,M.,直方图和核密度估计的经验选择,Scand。J.统计。,9, 65-78 (1982) ·Zbl 0501.62028号
[17] Ruppert,D。;Nettleton,D。;Gene Hwang,J.T.,探索p-值中的信息以分析和规划多重测试实验,生物统计学,63,483-495(2007)·Zbl 1152.62087号
[18] Scheid,S。;Spang,R.,估计局部错误发现率的随机下坡搜索算法,IEEE Trans。计算。生物.生物信息学,1,3,98-108(2004)
[19] Scheid,S。;斯潘,R.,《暮光之城》;用于估计局部错误发现率的生物导体包,生物信息学,21,12,2921-2922(2005)
[20] 施韦德,T。;Spjötvoll,E.,《同时评估多项测试的p值图》,Biometrika,69,493-502(1982)
[21] Scott,D.,《关于最优和基于数据的直方图》,《生物统计学》,66,3,605-610(1979)·Zbl 0417.62031号
[22] Shao,J.,通过交叉验证选择模型,J.Amer。统计师。协会,88,422,486-494(1993)·Zbl 0773.62051号
[23] Storey,J.D.,《错误发现率的直接方法》,J.Roy。统计师。Soc.序列号。B、 64,3479-498(2002年)·兹比尔1090.62073
[24] Storey,J.D。;Tibshirani,R.,全基因组研究的统计意义,Proc。美国国家科学院。科学。,100, 16, 9440-9445 (2003) ·Zbl 1130.62385号
[25] Storey,J。;泰勒,J.E。;Siegmund,D.,《错误发现率的强控制、保守点估计和同时保守一致性:统一方法》,J.Roy。统计师。Soc.序列号。B、 66、1、187-205(2004)·Zbl 1061.62110号
[26] 范德法特,A.W.,1998年。渐近统计学,剑桥统计与概率数学系列。剑桥大学出版社,剑桥(GB),纽约州西尼亚克;范德法特,A.W.,1998年。渐近统计学,剑桥统计与概率数学系列。剑桥大学出版社,剑桥(GB),纽约州西尼亚克·Zbl 0910.62001号
[27] Yang,Y.,比较回归程序的交叉验证一致性,Ann.Statist。,35, 2450-2473 (2007) ·Zbl 1129.62039号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。