郭文革;希亚马尔·佩达达 大规模多重测试中引导样本数的自适应选择。 (英语) Zbl 1276.62072号 统计应用程序。遗传学。分子生物学。 7,第1号,第13条,第19页(2008年). 摘要:在执行大规模多重测试时,通常使用重采样方法(例如bootstrap)来计算每个测试的\(p\)-值。引导值和错误发现率(FDR)的精度取决于用于测试每个假设的引导数。显然,引导数越大,精度越高。然而,所需的引导程序数量可能会增加计算负担,并且会使要执行的测试数量成倍增加。进一步增加的计算挑战是,在某些应用中,测试统计本身的计算可能需要相当长的计算时间。随着技术的进步,人们可以预期问题的规模也会增加。例如,在微阵列技术的早期,cDNA芯片上的探针数量不足10000个。现在Affymetrix芯片每个芯片有超过50000个探针。出于这一重要需求,我们开发了一种用于大规模多重测试的简单自适应引导方法,它减少了引导计算的总数,同时确保了对FDR的控制。该算法大大减少了引导样本的数量。基于模拟研究,我们发现,相对于Benjamini-Hochberg(BH)程序所需的引导程序数量,所提出的标准FDR方法在引导程序数量上实现了大幅减少。在某些情况下,新算法所需的引导程序数量仅为传统BH程序的1/6。因此,如果传统的BH程序使用1000个引导,那么所建议的方法只需要160个引导。该方法已在我们的软件ORIOGEN中用于时间进程/剂量反应数据,该软件可根据作者的要求提供。 引用于7文件 MSC公司: 62页第10页 统计学在生物学和医学中的应用;元分析 62F40型 引导、折刀和其他重采样方法 关键词:BH程序;引导数据库;置信区间;错误发现率;多次测试;\(p\)-值 软件:起源 PDF格式BibTeX公司 XML格式引用 \textit{W.Guo}和\textit{S.Peddada},统计应用。遗传学。分子生物学。7,第1号,第13条,第19页(2008年;Zbl 1276.62072) 全文: 内政部 链接