×

在一定依赖性下大规模模型检测的错误发现率。 (英语) Zbl 1388.62224号

摘要:在许多科学领域,确定观测到的数据流是否来自预先指定的模型是有趣且重要的,特别是当数据流数量很大时,需要进行多个假设测试。在本文中,我们考虑在同时观测到的不同数据流之间存在一定依赖性的情况下进行大规模模型检查。我们提出了一种错误发现率(FDR)控制程序来检查这些异常数据流。具体来说,我们推导了错误发现的近似值,并构造了FDR的点估计。理论结果表明,在一些温和的假设下,我们提出的FDR估计与真实FDR同时保守一致,因此它是一个渐近强控制过程。与一些竞争程序的仿真比较表明,我们提出的FDR程序在一般情况下表现更好。StarPlus fMRI数据说明了我们提出的FDR程序的应用。

MSC公司:

62J15型 配对和多重比较;多次测试
62G10型 非参数假设检验

软件:

FAMT公司
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 巴伯、R.F.和E.J.坎迪斯。2015年,通过仿冒品控制虚假发现率。《统计年鉴》43(5):2055-85·Zbl 1327.62082号
[2] Benjamini,Y.和Y.Hochberg,1995年。控制错误发现率:一种实用且强大的多重测试方法。英国皇家统计学会杂志,B辑57(1):289-300·Zbl 0809.62014号
[3] Benjamini,Y.和D.Yekutieli。2001.依赖性下多重测试中错误发现率的控制。《统计年鉴》29(4):1165-88·Zbl 1041.62061号
[4] Box,G.E.P.1954年。关于二次型的一些定理在方差分析问题研究中的应用,I:方差不等式在单向分类中的作用。《数理统计年鉴》25(2):290-302·Zbl 0055.37305号
[5] Desai、K.H.和J.D.Storey。2012.依赖高维数据的跨维推断。美国统计协会杂志107(497):135-51·Zbl 1261.62048号
[6] Efron,B.2007年。相关性和大规模同时显著性检验。美国统计协会杂志102(477):93-103·Zbl 1284.62340号
[7] Efron,B.2010年。相关z值和大规模统计估计的准确性。美国统计协会杂志105(491):1042-55·Zbl 1390.62139号
[8] Emery,X.2005年。估算可采储量的简单和普通多重高斯克立格法。数学地质学37(3):295-319·Zbl 1122.86306号
[9] Fan、J.和I.Gijbels。1996.局部多项式建模及其应用。纽约:查普曼和霍尔/CRC·Zbl 0873.62037号
[10] Fan,J.、X.Han和W.Gu.2012年。估计任意协方差依赖下的错误发现比例。美国统计协会杂志107(499):1019-35·Zbl 1395.62219号
[11] Fan、J.和Q.Yao。2003.非线性时间序列:非参数和参数方法。纽约:斯普林格·兹比尔1014.62103
[12] Fan,J.、C.Zhang和J.Zhang。2001.广义似然比统计和Wilks现象。《统计年鉴》29(1):153-93·Zbl 1029.62042号
[13] 弗里格、C.、M.Kloareg和D.Causeur。2009年,采用因子模型方法进行依赖性多重测试。美国统计协会杂志104(488):1406-15·Zbl 1205.62071号
[14] 甘迪,A.和F.D.-H.Lau。2013年,不启动累计和图表和错误发现率控制。生物特征100(1):261-68·Zbl 1284.62783号
[15] Gao,J.和I.Gijbels。2008.非参数内核测试中的带宽选择。美国统计协会杂志103(484):1584-94·Zbl 1286.62043号
[16] G'Sell、M.G.、S.Wager、A.Chouldechova和R.Tibshirani。2016.顺序选择程序和错误发现率控制。英国皇家统计学会杂志,B辑78(2):423-44·Zbl 1414.62341号
[17] Hao,N.、Y.S.Niu和H.Zhang。2013年,通过筛选和排序算法进行多个更改点检测。中国统计23(4):1553-72·Zbl 1417.62236号
[18] Hart,J.D.1997年。非参数平滑和缺乏fit测试。纽约:斯普林格·Zbl 0886.62043号
[19] Hong,Y.和Y.-J.Lee。2013.模型规范测试的损失函数方法及其相对效率。《统计年鉴》41(3):1166-203·Zbl 1293.62100号
[20] Leek、J.T.和J.D.Storey。2008年,多重测试依赖性的一般框架。美国国家科学院院刊105(48):18718-723·兹比尔1359.62202
[21] 里昂,R.1988。弱相关随机变量的强大数定律。密歇根数学杂志35(3):353-9·Zbl 0684.60025号
[22] Mei,Y.,2010年。用于监控大量数据流的高效可扩展方案。生物医学97(2):419-33·Zbl 1406.62088号
[23] 齐,D.,Z.Li和Z.Wang。2016年,在线监测高维数据流的数据质量。统计计算与模拟杂志86(11):2204-16·兹比尔1510.62481
[24] 里士满,A.2003。考虑品位不确定性的经济高效矿石选择。数学地质学35(2):195-215·Zbl 1040.91054号
[25] Schwartzman,A.和X.Lin,2011年。相关性对错误发现率估计的影响。《统计年鉴》98(1):199-214·Zbl 1215.62071号
[26] Shaffer,J.P.,1995年。多重假设检验。心理学年鉴46:561-84。
[27] Storey,J.D.2002年。错误发现率的直接方法。英国皇家统计学会杂志,B辑64(3):479-98·Zbl 1090.62073号
[28] Storey,J.D.、J.E.Taylor和D.Siegmund。2004.错误发现率的强控制、保守点估计和同时保守一致性:统一方法。英国皇家统计学会杂志,B辑66(1):187-205·Zbl 1061.62110号
[29] Wang、X.和T.Mitchell。2002.使用机器学习检测认知状态。临时工作文件。可从获取http://www.cs.cmu.edu/afs/cs.cmu.edu/project/theo-81/www/。
[30] Zhang,C.和T.Yu。2008.脑FMRI显著激活的半参数检测。统计年鉴36(4):1693-725·Zbl 1142.62026号
[31] 邹,C.,Z.Wang,X.Zi和W.Jiang。2015.一种高效的高维数据流在线监测方法。技术计量学57(3):374-87。
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。