生源地

大规模多重测试中自举样本数的自适应选择在进行大规模多重测试时,通常使用重采样方法(例如bootstrap)计算每个测试的p值。引导p值和错误发现率(FDR)的精度取决于用于测试每个假设的引导带数量。显然,引导次数越多,精度就越好。然而,所需数量的引导可能会造成计算上的负担,并且它会乘以要执行的测试的数量。进一步增加计算挑战的是,在某些应用中,计算测试统计本身可能需要相当长的计算时间。随着技术的进步,人们可以预期问题的规模也会增加。例如,在微阵列技术的早期,cDNA芯片上的探针数量不到10000个。现在Affymetrix芯片每个芯片有超过50000个探针。基于这一重要需求,我们开发了一种简单的适用于大规模多重测试的自适应引导方法,在保证FDR控制的同时,减少了引导计算的总数。该算法大大减少了引导样本的数量。基于模拟研究,我们发现,相对于Benjamini-Hochberg(BH)程序所需的引导次数,标准FDR方法(即建议的方法)实现了引导次数的大幅减少。在某些情况下,新算法所需的引导次数仅为传统BH过程的1/6。因此,如果传统的BH过程使用1000个引导,那么所提出的方法只需要160个引导。该方法已在我们的软件ORIOGEN中实现,可根据要求从作者处获得时间过程/剂量反应数据。

这个软件也是同行评审按日记帐汤姆斯.


zbMATH参考文献(16篇文章引用)

显示第1到16个结果,共16个。
按年份排序(引用)

  1. 哈恩,乔治:蒙特卡罗模拟对多假设检验的最优分配(2020)
  2. 哈恩,格奥尔格:关于多个有界误差测试算法的预期运行时间(2020)
  3. 2018年,Milozin2018年,用Milozin2018年的数据,复制到Cinozizer;复制时间:Milozizer
  4. Davidov,Ori;Jelsema,Casey M.;Peddada,Shymal:通过修剪或Winsoring方差矩阵测试奇异模型中的不等式约束(2018)
  5. Hahn,Georg:多重测试程序类的闭包性质(2018)
  6. 王一石;斯台普顿,安E;陈翠贤:两样本非参数随机序推断及其在植物生理学中的应用(2018)
  7. Gandy,Axel;Hahn,Georg:QuickMMCTest:快速多重蒙特卡罗测试(2017)
  8. Gandy,Axel;Hahn,Georg:基于蒙特卡洛的多重测试框架(2016)
  9. Sweeney,Elizabeth;Crainiceanu,Ciprian;Gertheiss,Jan:剂量反应研究和有序表型中差异表达基因的测试(2016)
  10. Gandy,Axel;Hahn,Georg:MMCTest——实现多个蒙特卡罗测试的安全算法(2014)
  11. 辛哈,安舒;马卡图,马里安提:一个处理短时间序列(害虫)表达的平台(2011)ioport公司
  12. Lim,Changwon;Sen,Pranab K.;Peddada,Shyamal D.:异方差下非线性回归的统计推断(2010)
  13. Mathur,Sunil K.:统计生物信息学与R(2010)
  14. Peddada,Shyamal D.;Umbach,David M.;Harris,Shawn F.:在短时间过程微阵列实验中,对基于信息标准的聚类与顺序受限候选特征的反应(2009)ioport公司
  15. Rueda,Cristina;Fernández,Miguel A.;Salvador,Bonifacio:有序预测的Bayes判别规则(2009)
  16. 郭文革;Peddada,Shymal:大规模多重测试中自举样本数的自适应选择(2008)