×

真零假设比例的偏差修正估计:分段故障数据中自适应FDR控制的应用。 (英语) Zbl 07611117号

摘要:针对多假设测试场景下的真零假设比例((pi_0)),最近引入了两个基于模型的偏差修正估计量,并在适用于每个常见假设的适当失效模型下进行了随机观察。基于随机排序,给出了(\pi_0)的一些相关估计公式背后的一个新的动机。从理论上证明了基于模型的估计量的偏差减少,并给出了计算估计量的算法。这些估计量还用于制定一个流行的自适应多重测试程序。广泛的数值研究支持了偏差修正估计量的优越性。强调了在基于模型的偏差修正方法中对失效数据进行适当分布假设的必要性。使用与可靠性和保修研究相关的真实数据集进行案例研究,以证明该程序在非高斯设置下的适用性。所得结果与课题专家的直觉和经验相符。一个有趣的讨论试图总结这篇文章,也指出了未来的研究范围。

MSC公司:

62至XX 统计
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Y.本杰米尼。;Hochberg,Y.,《控制错误发现率:一种实用而强大的多重测试方法》,J.R.Statist。Soc.系列。B(统计方法),57289-300(1995)·Zbl 0809.62014号
[2] Y.本杰米尼。;Krieger,A.M。;Yekutieli,D.,控制错误发现率的自适应线性加速程序,Biometrika,93,491-507(2006)·Zbl 1108.62069号
[3] Biswas,A.,基于p值总和估计真零假设的比例以及在微阵列数据中的应用,Commun。统计模拟。计算。,1-15 (2020) ·Zbl 07632205号 ·doi:10.1080/03610918.2020.1800036
[4] 布兰查德,G。;Roquain,E.,独立性和依赖性下的自适应错误发现率控制,J.Mach。学习。,10, 12, 2837-2871 (2009) ·Zbl 1235.62093号
[5] Chen,J.J。;王世杰。;蔡,C.A。;Lin,C.J.,微阵列数据分析中差异表达基因的选择,药物基因组学。J.,7,212-220(2007)
[6] Cheng,Y。;高,D。;Tong,T.,估计真无效假设比例时的偏差和方差减少,生物统计学,16189-204(2015)
[7] 克雷乌,R.V。;Sun,L.,《选择较小的邪恶:错误发现率和未发现率之间的权衡》,《犯罪统计》。,18, 861-879 (2008) ·Zbl 1533.62054号
[8] Gianetto,Q.G.,Combes,F.,Ramus,C.,和Gianetton,M.Q.G..,包装“cp4p”。(2019). 可在https://cran.r-project.org/web/packages/cp4p/cp4p.pdf。
[9] 关,Z。;吴,B。;赵,H.,基于伯恩斯坦多项式的错误发现率的非参数估计,Stat.Sin。,18, 905-923 (2008) ·Zbl 1149.62027号
[10] Gupta,S.K。;德·S。;Chatterjee,A.,《不完整二维保修索赔数据的一些可靠性问题》,Reliab。工程系统。安全。,157, 64-77 (2017)
[11] Hung,H.J。;奥尼尔,R.T。;鲍尔,P。;Kohne,K.,当替代假设成立时p值的行为,生物计量学,53,11-22(1997)·Zbl 0876.62015号
[12] 姜浩。;Doerge,R.W.,《估算多重比较的真零假设比例》,《癌症》。通知。,6, 25-32 (2008)
[13] Langaas,M。;Lindqvist,B.H。;Ferkingstad,E.,估算真零假设的比例,并应用于DNA微阵列数据,J.R.Statist。Soc.系列。B(Stat.Methodol.),67,555-572(2005)·Zbl 1095.62037号
[14] Lawless,J.F.,《产品保修数据的统计分析》,《国际统计评论》,66,41-60(1998)·Zbl 0893.62099号
[15] Markitsis,A。;Lai,Y.,估计非差异表达基因比例的删失β混合模型,生物信息学,26,640-646(2010)
[16] Nettleton,D。;Hwang,J.G。;Caldo,R.A。;Wise,R.P.,《从P值直方图估计真零假设的数量》,J.Agric。生物与环境。《统计》,第11卷,第337-356页(2006年)
[17] 奥斯特罗夫纳亚,I。;Nicolae,D.L.,估计依赖性下真零假设的比例,Stat.Sin。,22, 1689-1716 (2012) ·Zbl 1253.62053号
[18] 磅,S。;Cheng,C.,错误发现率的稳健估计,生物信息学,221979-1987(2006)
[19] 磅,S。;Morris,S.W.,通过近似和划分p值的经验分布估计微阵列研究中假阳性和假阴性的发生,生物信息学,19,1236-1242(2003)
[20] Sarkar,S.K.,《关于控制错误发现率的方法》,Sankhy(####):印度J.Stat.Ser。A、 70135-168(2008)·Zbl 1193.62121号
[21] 萨卡,S.K。;郭伟。;Finner,H.,《关于控制家庭错误率的自适应程序》,J.Stat.Plan。推理,142,65-78(2012)·Zbl 1368.62219号
[22] Storey,J.D.,《错误发现率的直接方法》,J.R.Stat.Soc.Ser。B(Stat.Methodol.),64,479-498(2002)·Zbl 1090.62073号
[23] Storey,J.D.和Tibshirani,R.,DNA微阵列中检测差异基因表达的SAM阈值和错误发现率,载于《基因表达数据分析》,Springer,纽约州纽约市,2003年,第272-290页。
[24] 斯托里,J.D。;泰勒,J.E。;Siegmund,D.,《错误发现率的强控制、保守点估计和同时保守一致性:统一方法》,J.R.Statist。Soc.系列。B(Stat.Methodol.),66,187-205(2004)·Zbl 1061.62110号
[25] Tong,T。;Z.Feng。;希尔顿,J.S。;Zhao,H.,使用观察到的p值模式估计真零假设的比例,J.Appl。《统计》,第40卷,1949-1964年(2013年)·Zbl 1514.62899号
[26] 王洪秋。;Tuominen,L.K。;Tsai,C.J.,SLIM:一个用于估计具有依赖结构的数据集中真零假设比例的滑动线性模型,生物信息学,27225-231(2010)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。