×

基于错误发现率的最优两阶段全基因组关联设计。 (英语) Zbl 1157.62543号

摘要:在不久的将来,可能会大规模进行全基因组关联研究。在这些研究中,搜索数十万个与疾病相关的少数标记会带来严重形式的多假设测试问题。我们采用两阶段设计,探讨了错误发现率(FDR)的使用当存在多个因果变异时,可以减轻单标记检测的严格显著性水平的负担,并且仍然可以控制假阳性结果的数量。FDR是所有重要发现中假阳性的预期比例。它可以近似为\((1-p_{0})\alpha/[(1-p_0})\ alpha+p_{0}(1-\beta)]\),其中\(p_{0}\)是真正的因果标记的比例,\(alpha\)是I型错误率,\(1-\beta)是两阶段研究的威力。当500000个SNP在第一阶段用固定的SNP阵列进行基因分型,而最重要的SNP在第二阶段用标准但更昂贵的高通量技术进行基因分型时,在(10^{-5})到(5^乘以10^{-4})范围内,(p_{0})的最小基因分型成本可节省多达20%与使用Bonferroni校正显著性水平时相比,FDR在0.05至0.7的范围内。就样本量而言,节省高达60%。然而,这些节省是以更多假阳性结果为代价的。

MSC公司:

第62页第10页 统计学在生物学和医学中的应用;元分析
92C40型 生物化学、分子生物学
92D10型 遗传学和表观遗传学
62J15型 配对和多重比较;多次测试
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Y.本杰米尼。;Drai,D。;Elmer,G。;卡夫卡菲,N。;Golani,I.,控制行为遗传学研究中的错误发现率,Behav。《大脑研究》,125,279-284(2001)
[2] Dudbridge,F。;Koeleman,B.P.,《相关数据大型研究中多重关联显著性水平的有效计算,包括全基因组关联研究》,美国人类遗传学杂志。,75, 424-435 (2004)
[3] Gauderman,W.J.,基因与环境相互作用匹配病例对照研究的样本量要求,《统计医学》,21,35-50(2002)
[4] Hirschorn,J.N。;Daly,M.J.,《常见疾病和复杂性状的全基因组关联研究》,《国家遗传学评论》。,6, 95-108 (2005)
[5] Klein,R.J。;蔡司,C。;周,E.Y。;蔡,J。;Sackler,R.S。;海恩斯,C。;Henning,A.K。;SanGiovanni,J.P。;马内,S.M。;Mayne,S.T。;Bracken,M.B。;费里斯,F.L。;奥特·J。;巴恩斯塔布尔,C。;Hoh,J.,《年龄相关性黄斑变性中的补体因子H多态性》,《科学》,308385-388(2005)
[6] Kraft,P.,基于假阳性报告概率的高效两阶段全基因组关联设计,Pac。交响乐团。生物计算机,11523-534(2006)
[7] Lin,D.Y.,《评估两阶段全基因组关联研究的统计显著性》,美国遗传学杂志。,78, 505-509 (2006)
[8] Longmate,J.A.,《病例对照关联研究中的复杂性和权力》,美国遗传学杂志。,68, 1229-1237 (2002)
[9] Nyholt,D.R.,《相互连锁不平衡中单核苷酸多态性多重检测的简单修正》,美国遗传学杂志。,74765-769(2004年)
[10] 齐藤,A。;Kamatani,N.,《全基因组关联研究的策略:通过逐步聚焦方法优化研究设计》,J.Hum.Genet。,47, 360-365 (2002)
[11] 萨塔戈潘,J.M。;Elston,R.C.,基于人群的关联研究中的最佳两阶段基因分型,遗传学。流行病。,25, 149-157 (2003)
[12] 萨塔戈潘,J.M。;Verbel,D.A。;Venkatraman,E.S。;Offit,K.E。;Begg,C.B.,基因疾病关联研究的两阶段设计,生物统计学,58163-170(2002)·Zbl 1209.62326号
[13] 斯科尔,A.D。;斯科特·L·J。;Abecasis,G.R。;Boehnke,M.,对于两阶段全基因组关联研究,联合分析比基于复制的分析更有效,《自然遗传学》。,38, 209-213 (2006)
[14] Storey,J.D。;Tibshirani,R.,全基因组研究的统计意义,Proc。国家。阿卡德。科学。美国,1009440-9445(2003)·Zbl 1130.62385号
[15] 人类基因组的单倍型图,《自然》,4371299-1321(2005)
[16] 托马斯博士。;Haile,R.W。;Duggan,D.,《全基因组关联扫描的最新发展:研讨会摘要和综述》,美国遗传学杂志。,77, 337-345 (2005)
[17] van den Oord,E.J.C.G。;Sullivan,P.F.,《控制错误发现率和最小化疾病突变搜索中基因分型数量的框架》,Hum.Hered。,56, 188-199 (2003)
[18] Wacholder,S.、Chanock,S.,Garcia-Closas,M.、El Ghormli,L.、Rothman,N.,2004年。评估阳性报告为假的概率:分子流行病学研究的一种方法。J.国家。癌症研究所96434-342。;Wacholder,S.、Chanock,S.,Garcia-Closas,M.、El Ghormli,L.、Rothman,N.,2004年。评估阳性报告为假的概率:分子流行病学研究的一种方法。J.国家。癌症研究所96,434-342。
[19] Wang,H。;D.C.托马斯。;佩尔,我。;斯特拉姆,D.O.,《全基因组关联扫描的最佳两阶段基因分型设计》,《遗传学》。流行病。,30, 356-368 (2006)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。