×

从错误分类看多样性。 (英语) Zbl 1358.62023号

摘要:近年来,利用微阵列基因组数据和功能神经成像数据进行大规模研究的多样性已成为一个广泛研究的课题。研究人员在实践中经常使用的一个选项是“顶表”,它包括按一定顺序(p值或测试统计)对假设进行排序,并报告顶结果。这有直接的实际应用,因为我们有一个值得跟进的“有趣”结果列表,而不管实际值(调整或未调整)如何。在这篇手稿中,我们用顶表重新审视了多样性。我们的方法旨在在理论和实践之间达成妥协。我们研究了正确分类的概率(我们称之为\(r)-幂(在顶部-(r)表中选择的单位确实来自备选单位)与\(r \)值之间的关系。我们从顺序统计的角度分析性地定义了幂,并量化了正确分类的概率。我们使用数值积分计算作为效应大小函数的(r)幂,(δ);被测假设的数量,(N);来自零的假设数,\(k);和\(r\)。我们的结果表明,(r)-幂与效应大小呈正相关,与(k/N)呈负相关。与\(r\)的关系取决于\(r<k\)。我们的结果有两种可能的用途:基于预先选择的幂,我们可以计算并决定要跟进的假设的数量,或者如果使用其他标准计算,我们可以使用我们的方法在这种情况下计算幂。我们用微阵列和功能磁共振成像数据的例子来说明这些想法。

MSC公司:

62F03型 参数假设检验
62页第10页 统计学在生物学和医学中的应用;元分析
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Abbott D.F.、Waites A.B.、Lillywhite L.M.和Jackson G.D.(2010年)。fMRI评估语言偏侧化:一种客观方法。《神经影像》,第50期,第1446-1455页·doi:10.1016/j.neuroimage.2010.01.059
[2] Benjamini Y.和Hochberg Y.(1995年)。控制错误发现率:一种实用且强大的多重测试方法。J.R.统计社会服务。B、 第57页,第289-300页·Zbl 0809.62014号
[3] Benjamini Y.和Yekutieli D.(2001年)。依赖下多重测试中错误发现率的控制。安.统计师。,29, 1165-1188. ·Zbl 1041.62061号 ·doi:10.1214/aos/1013699998
[4] Brown D.A.、Lazar N.A.、Datta G.S.、Jang W.和McDowell J.E.(2014)。将空间相关性纳入功能神经成像中统计参数图的贝叶斯多重测试。《神经影像》,84,97-112·doi:10.1016/j.欧洲图像.2013.08.024
[5] Camchong J.、Dyckman K.A.、Austin B.P.、Clementz B.A.和McDowell J.E.(2008年)。精神分裂症患者及其亲属中支持自主性扫视及其中断的常见神经回路。《生物精神病学》,641042-1050·doi:10.1016/j.biopych.2008.06.015
[6] Chiaretti S.、Li X.、Gentleman R.、Vitale A.、Vignetti M.、Mandelli F.、Ritz J.和Foa R.(2004)。成人T细胞急性淋巴细胞白血病的基因表达谱确定了对治疗和生存有不同反应的患者的不同亚群。血液,103,2771-2778·doi:10.1182/bloud-2003-09-3243
[7] Chiaretti S.、Li X.、Gentleman R.、Vitale A.、Wang K.S.、Mandelli F.、Foa R.和Ritz J.(2005)。B系成人急性淋巴细胞白血病的基因表达谱揭示了确定谱系起源和不同转化机制的遗传模式。临床。癌症研究,11,7209-7219·doi:10.1158/1078-0432.CCR-04-2165
[8] Dudoit S.、Yang Y.H.、Callow M.J.和Speed T.P.(2002年)。在复制cDNA微阵列实验中识别差异表达基因的统计方法。统计师。西尼卡,12111-139·Zbl 1004.62088号
[9] Efron B.、Tibshirani R.、Storey J.D.和Tusher V.(2001年)。微阵列实验的经验贝叶斯分析。J.Amer。统计师。协会,96,1151-1160·兹比尔1073.62511 ·doi:10.1198/016214501753382129
[10] Ge Y.、Dudoit S.和Speed T.P.,2003年,基于重采样的多重测试用于微阵列数据分析。加州大学伯克利分校统计系第633号技术报告·Zbl 1056.62117号
[11] Hahne F.、Huber W.和Gentleman R.(2008)。生物导体案例研究。纽约州斯普林格。 ·doi:10.1007/978-0-387-77240-0
[12] Heller R.、Stanley D.、Yekutieli D.、Rubin N.和Benjamini Y.(2006年)。fMRI数据的聚类分析。神经影像,33,599-608·doi:10.1016/j.neuroimage.2006.04.233
[13] Hochberg Y.(1988)。用于多个重要测试的更清晰的Bonferroni程序。生物特征,75800-803·Zbl 0661.62067号 ·doi:10.1093/biomet/75.4.800
[14] Hochberg Y.和Tamhane A.C.(1987年)。多重比较程序。纽约州威利·Zbl 0731.62125号 ·数字对象标识代码:10.1002/9780470316672
[15] 霍尔姆S.(1979)。一个简单的顺序拒绝多重测试程序。扫描。《美国统计杂志》,第6卷,第65-70页·Zbl 0402.62058号
[16] Hommel G.(1988)。基于改进的Bonferroni试验的分阶段拒绝多重试验程序。生物特征,75,383-386·Zbl 0639.62025号 ·doi:10.1093/biomet/75.2.383
[17] Knecht S.、Jansen A.、Frank A.、van Randenborgh J.、Sommer J.、Kanowski M.和Heinze H.J.(2003年)。非典型语言支配有多非典型?神经影像18,917-927·doi:10.1016/S1053-8119(03)00039-9
[18] Kuo C.-L.和Zaykin D.(2013年)。排序概率方法及其在大规模研究设计和分析中的应用。公共图书馆ONE8,12,e83079。doi:10.1371/journal.pone.0083079·doi:10.1371/journal.pone.0083079
[19] Kuo C.L.和Zaykin D.V.(2011年)。全基因组关联研究中新的基于秩的发现和复制方法。遗传学,189,329-340·doi:10.1534/genetics.11.130542
[20] Leone F.C.、Nottingham R.B.和Nelson L.S.(1961年)。折叠正态分布。技术计量学,3543-550·doi:10.1080/00401706.1961.10489974
[21] Miller Jr R.G.(1981)。同步统计推断,第2版。纽约州斯普林格·Zbl 0463.6202号 ·doi:10.1007/978-1-4613-8122-8
[22] Nichols T.和Hayasaka S.(2003年)。控制功能神经成像中的家庭错误率:一项比较综述。统计方法医学研究,12,419-446·Zbl 1121.62645号 ·doi:10.1191/0962280203sm341ra
[23] Nichols T.E.和Holmes A.P.(2002年)。功能神经成像的非参数排列测试:一个带示例的引物。嗯,脑图。,15, 1-25. ·doi:10.1002/hbm.1058
[24] 潘伟(2002)。在重复微阵列实验中发现差异表达基因的统计方法的比较综述。生物信息学,18546-554·doi:10.1093/bioinformatics/18.4.546
[25] Sarkar S.(1998)。有序mtp2随机变量的一些概率不等式:Simes猜想的证明。安.统计师,26494-504·Zbl 0929.62065号 ·doi:10.1214/aos/1028144846
[26] Simes R.J.(1986)。一种改进的Bonferroni程序,用于多项显著性测试。生物特征,73751-754·Zbl 0613.62067号 ·doi:10.1093/biomet/73.3.751
[27] Smyth G.K.、Yang Y.-H.和Speed T.P.(2003)。cDNA微阵列数据分析中的统计问题。方法分子生物学。,224, 111-136.
[28] Smyth G.K.和Speed T.P.(2003年)。cDNA微阵列数据的规范化。方法,31,265-273·doi:10.1016/S1046-2023(03)00155-5
[29] Smyth G.K.2005 Limma:微阵列数据的线性模型。在生物信息学和计算生物学解决方案中使用R和生物导体。(R.Gentleman、V.Carey、S.Dudoit、R.Irizarry和W.Huber编辑)第397-420页。纽约州施普林格。
[30] Storey J.D.(2002)。错误发现率的直接方法。J.R.统计社会服务。B、 64,479-498·Zbl 1090.62073号 ·doi:10.111/1467-9868.00346
[31] Storey J.D.(2003)。正错误发现率:贝叶斯解释和q值。安.统计师。,31, 2013-2035. ·Zbl 1042.62026 ·doi:10.1214/aos/1074290335
[32] Storey J.D.(2007)。最优发现过程:同步显著性测试的新方法。J.R.统计社会服务。B、 69、347-368页·兹伯利07555356 ·doi:10.1111/j.1467-9868.2007.005592.x
[33] Storey J.D.2011年FDR。在国际统计科学百科全书中。(M.Lovric编辑)第504-508页。柏林施普林格·Zbl 1241.62001号
[34] Talairach J.和Tournoux P.(1988年)。人脑共面立体定向图谱:三维比例系统-脑成像方法。Thieme Medical Publishers,纽约。
[35] Worsley K.J.(2003)。检测fMRI数据中的激活。统计方法医学研究,12,401-418·Zbl 1121.62678号 ·doi:10.1191/0962280203sm340ra
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。