×

控制错误发现率的两阶段设计的样本量重新评估。 (英语) Zbl 1330.92014年

摘要:基因表达微阵列和NGS-RNA-Seq实验的样本量计算具有挑战性,因为总功率取决于未知量,即真零假设的比例和替代方案下效应大小的分布。我们提出了一种两阶段设计,采用自适应中期分析,其中这些数量是根据中期数据估算的。基于这些估计来选择第二阶段样本大小,以实现特定的总体功率。除了极低的第一阶段样本量外,建议的程序控制了所有考虑场景中的功率。尽管样本大小的选择依赖于数据,但错误发现率(FDR)仍得到控制。如果在规划阶段,预期效应大小和可变性存在高度不确定性,则两阶段设计可以成为确定高维研究样本大小的有用工具。

MSC公司:

92B15号机组 普通生物统计学
62F03型 参数假设检验
62D05型 抽样理论、抽样调查
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Bauer,P.和K.Köhne(1994):“利用适应性中期分析评估实验”,《生物计量学》,第50期,第1029-1041页·Zbl 0825.62789号
[2] Benjamini,Y.和Y.Hochberg(1995):“控制错误发现率:一种实用而强大的多重测试方法”,J.R.Stat.Soc.B,57289-300·Zbl 0809.62014号
[3] Benjamini,Y.和D.Yekutieli(2001):“依赖性下多重测试中错误发现率的控制”,《Ann.Stat.》,第29期,第1165-1188页·Zbl 1041.62061号
[4] Brannath,W.、M.Posch和P.Bauer(2002):“递归组合测试”,《美国统计协会期刊》,第97期,第236-244页·Zbl 1073.62550号
[5] 联合会,T.G.O.(2000):“基因本体论:生物学统一的工具”,《自然遗传学》。,25(1), 25-29.;
[6] Delongchamp,R.R.、J.Bowyer,J.Chen和R.Kodell(2004):“分析基因表达的cdna阵列数据的多重测试策略”,《生物计量学》,60,774-782·Zbl 1274.62755号
[7] Edgar,R.、M.Domrachev和A.Lash(2002):“基因表达综合:Ncbi基因表达和杂交阵列数据存储库”,纽卡斯尔大学。《酸类研究》,30207-210。;
[8] Efron,B.(2010):“z值和大规模统计估计的准确性”,《美国统计协会期刊》,第105期,第1042-1055页·Zbl 1390.62139号
[9] Genovese,C.和L.Wasserman(2002):“错误发现率程序的操作特征和扩展”,J.R.Stat.Soc.B,64,499-517·Zbl 1090.62072号
[10] Graf,A.C.和P.Bauer(2011):“当样本大小和分配率在预先计划的中期外观中进行调整时,第1类错误率的最大膨胀”,《Stat.Med.》,第30卷,第1637-1647页。;
[11] Graf,A.C.、P.Bauer、E.Glimm和F.Koenig(2014):“自适应中期样本量修改的多臂临床试验中的最大1类错误率膨胀”,《生物医学杂志》,56(4),614-630·Zbl 1441.62357号
[12] Jung,S.H.(2005):“微阵列数据分析中fdr控制的样本量”,生物信息学,213097-3104。;
[13] Langaas,M.、B.Lindqvist和E.Ferkingstad(2005):“应用于dna微阵列数据,估算真零假设的比例”,《J.R.Stat.Soc.B》,678,555-572·Zbl 1095.62037号
[14] Matsui,S.和H.Noma(2011):“在微阵列实验中评估差异表达基因的功效大小和样本大小”,《生物计量学》,671225-1235·Zbl 1274.62839号
[15] Müller,H.-H.和H.Schäfer(2001):“临床试验的适应性组序贯设计:结合适应性和经典组序贯方法的优点”,《生物计量学》,57886-891·Zbl 1209.62180号
[16] Muralidharan,O.(2010):“效应大小和错误发现率估计的经验贝叶斯混合方法”,《应用统计学年鉴》,4222-438·Zbl 1189.62004号
[17] Muralidharan,O.(2012):“mixfdr:使用正常混合计算错误发现率和效果大小”,URL,r包版本1.0。;
[18] Norris,A.W.和C.Kahn(2006):“病理生理状态下的基因表达分析:平衡假发现和假阴性率”,Proc。美国国家科学院。科学,103,649-653。;
[19] Pawitan,Y.、S.Michiels、S.Koscielny、A.Gusnanto和A.Ploner(2005):“微阵列研究的错误发现率、敏感性和样本量”,生物信息学,21,3017-3024。;
[20] Posch,M.和P.Bauer(1999):“自适应两阶段设计和条件误差函数”,《生物医学杂志》,41,689-696·兹比尔0943.62077
[21] Posch,M.、P.Bauer和W.Brannath(2003):“设计灵活试验的问题”,《Stat.Med.》,第23期,第953-969页。;
[22] Posch,M.、S.Zehetmayer和P.Bauer(2009):“用错误发现率寻找意义”,《美国统计协会期刊》,第104期,第836-840页·Zbl 1388.62237号
[23] Proschen,M.A.和S.A.Hunsberger(1995):“基于条件功率的研究扩展设计”,《生物计量学》,第51期,第1315-1324页·Zbl 0875.62506号
[24] 邱,X.,A.I.Brooks,L.Klebanov和A.Yakovlev(2005):“微阵列数据相关结构标准化的影响”,BMC生物信息学,6,1-11。;
[25] Qu,L.、D.Nettleton和J.Dekkers(2012):“从大量t统计量中改进非中心性参数分布的估计,并应用于微阵列数据分析中的错误发现率估计,”生物计量学,681178-1187·Zbl 1274.62857号
[26] R核心团队(2013):R:统计计算的语言和环境,R统计计算基金会,奥地利维也纳。;
[27] Smyth,G.K.(2005):“Limma:微阵列数据的线性模型”,载于R.Gentleman,V.Carey,S.Dudoit,R.Irizarry和W.Huber,eds.,《使用R和生物导体的生物信息学和计算生物学解决方案》,纽约:Springer,397-420。;
[28] Storey,J.、J.Taylor和D.Siegmund(2004):“错误发现率的强控制、保守点估计和同时保守一致性:统一方法”,J.R.Stat.Soc.B,66,187-205·Zbl 1061.62110号
[29] Storey,J.D.(2002):“错误发现率的直接方法”,J.R.Stat.Soc.B,64,479-498·Zbl 1090.62073号
[30] Tibshirani,R.(2006):“微阵列实验中评估样本大小的简单方法”,BMC生物信息学,7106。;
[31] van Iterson,M.、M.van de Wiel、J.Boer和R.de Menezes(2013):“高维基因组数据的一般功率和样本量计算”,《统计应用》。遗传学。分子生物学。,4, 449-467.; ·2015年11月13日
[32] Zehetmayer,S.、P.Bauer和M.Posch(2005):“使用大量假设进行实验的两阶段设计”,生物信息学,21,3771-3777。;
[33] Zehetmayer,S.和M.Posch(2010):“大规模多重测试问题中的事后功率估计”,生物信息学,261050-1056。;
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。