×

高维线性模型的空间松弛推理。 (英语) Zbl 1496.62008年

摘要:当协变量在其相关性中具有潜在的空间组织时,我们考虑高维线性模型的推理问题。这种设置的典型示例是高分辨率成像,其中相邻像素通常非常相似。在这种情况下,如果协变量比样本多,而且协变量之间相关性高,则不可能进行精确的点和置信区间估计。这要求重新制定统计推断问题,并考虑到潜在的空间结构:如果协变量是局部相关的,则可以在给定的空间不确定性范围内检测它们。因此,我们建议依赖(delta)-FWER,也就是说,在距离任何真正的距离大于(delta。考虑到这一目标度量,我们研究了集成聚类推理算法的特性,这些算法结合了三种技术:空间约束聚类、统计推理和集成来聚合多个聚类推理解决方案。我们证明,在标准假设下,集成聚类推理算法控制着(delta)-FWER,因为(delta”)等于最大聚类直径。我们用实证结果补充了理论分析,证明了这种推理算法可以实现精确的(delta)-FWER控制和可观的功率。

MSC公司:

62-08 统计问题的计算方法
62J05型 线性回归;混合模型
62J07型 岭回归;收缩估计器(拉索)
62甲12 多元分析中的估计
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 巴赫,F.R.:博拉索:通过bootstrap进行模型一致的拉索估计。载:《第25届国际机器学习大会论文集》,第33-40页(2008年)
[2] 理发师,RF;Candès,E.,《通过仿冒品控制虚假发现率》,《Ann.Stat.》,第43、5、2055-2085页(2015年)·Zbl 1327.62082号 ·doi:10.1214/15-AOS1337
[3] PC公司Bellec;Zhang,C-H,用自由度调节来消除拉索的偏置,伯努利,28,27113-743(2022)·Zbl 07526563号 ·doi:10.3150/21-BEJ1348
[4] 伯克,R。;布朗,L。;Buja,A。;张凯。;Zhao,L.,有效的后选择推理,Ann.Stat.,41,2,802-837(2013)·兹比尔1267.62080 ·doi:10.1214/12-AOS1077
[5] 布兰查德,G。;Geman,D.,模式识别的层次测试设计,Ann.Stat.,33,3,1155-1202(2005)·Zbl 1072.62052号 ·doi:10.1214/009053605000000174
[6] Bühlmann,P.,《高维线性模型的统计意义》,伯努利,19,4,1212-1242(2013)·Zbl 1273.62173号 ·doi:10.3150/12-BEJSP11
[7] Bühlmann,P。;Rütimann,P。;van de Geer,S。;Zhang,C-H,回归中的相关变量:聚类和稀疏估计,J.Stat.Plan。推理,143,11,1835-1858(2013)·Zbl 1278.62103号 ·doi:10.1016/j.jspi.2013.05.019
[8] Candès,E.,Fan,Y.,Janson,L.,Lv,J.:淘金:高维受控变量选择的“X型”仿制品。J.R.统计社会服务。B统计方法。80(3), 551-577 (2018) ·Zbl 1398.62335号
[9] 查特吉,A。;Lahiri,SN,Bootstrapping Lasso estimators,美国统计协会,106,494,608-625(2011)·Zbl 1232.62088号 ·doi:10.1198/jasa.2011.tm10159
[10] Cheng,D。;何,Z。;Schwartzman,A.,检测变化点的局部极值多重测试,电子。J.Stat.,第14、2、3705-3729页(2020年)·兹比尔1452.62623 ·doi:10.1214/20-EJS1751
[11] Chevalier,J.-A.,Salmon,J.,Thirion,B.:用集群去散化拉索集合进行统计推断。摘自:医学图像计算和计算机辅助干预国际会议,第638-646页。施普林格(2018)
[12] 骑士,J-A;Gramfort,A。;沙门,J。;Thirion,B.,用解量化多任务Lasso进行时空MEG/EEG源成像的统计控制,高级神经信息处理。系统。,33, 1759-1770 (2020)
[13] Chevalier,J.-A.,Nguyen,T.-B.,Salmon,J.,Varoqueux,G.,Thirion,B.:自信解码:解码器映射的统计控制。神经影像学117921(2021)
[14] Dehman,A。;安布罗斯,C。;Neuvial,P.,利用连锁不平衡信息进行变量选择的分块方法的性能,BMC生物信息。,16148(2015年)·doi:10.1186/s12859-015-0556-6
[15] Dezeure,R。;Bühlmann,P。;Meier,L。;Meinshausen,N.,《高维推断:置信区间,(p\)-值和R软件hdi》,《统计科学》。,30, 4, 533-558 (2015) ·Zbl 1426.62183号 ·doi:10.1214/15-STS527
[16] OJ Dunn,《均值之间的多重比较》,《美国统计协会期刊》,56,293,52-64(1961)·Zbl 0103.37001号 ·doi:10.1080/01621459.1961.10482090
[17] Gimenez,J.R.,Zou,J.:发现具有统计保证的条件显著特征。摘自:机器学习国际会议,第2290-2298页(2019年)
[18] Hoyos-Idrobo,A。;瓦罗佐,G。;Kahn,J。;Thirion,B.,递归最近凝聚(ReNA):结构信号近似的快速聚类,IEEE Trans。模式分析。机器。智力。,41, 3, 669-681 (2018) ·doi:10.1109/TPAMI.2018.2815524
[19] Janson,L。;Su,W.,《通过仿冒品实现家庭差错率控制》,Electron。J.Stat.,10,1,960-975(2016)·Zbl 1341.62245号 ·doi:10.1214/16-EJS1129
[20] 爪哇马德,A。;Montanari,A.,高维回归的置信区间和假设检验,J.马赫。学习。第15号决议,2869-2909(2014年)·Zbl 1319.62145号
[21] 爪哇马德,A。;Montanari,A.,Debising the Lasso:高斯设计的最佳样本量,《美国统计年鉴》,46,6,2593-2622(2018)·Zbl 1407.62270号 ·doi:10.1214/17-AOS1630
[22] 罗克哈特。;泰勒,J。;RJ Tibshirani;Tibshirani,R.,《拉索的显著性检验》,Ann.Stat.,42,2,413(2014)·Zbl 1305.62254号
[23] Meinshausen,N.,《可变重要性的层次测试》,《生物统计学》,95,2,265-278(2008)·兹比尔1437.62557 ·doi:10.1093/biomet/asn007
[24] Meinshausen,N:。组界:稀疏高维回归中变量组的置信区间,无需对设计进行假设。J.R.统计社会服务。B统计方法。923-945 (2015) ·Zbl 1414.62060号
[25] 明绍森,N。;Bühlmann,P.,稳定性选择,J.R.Stat.Soc.Ser。B统计方法。,72, 417-473 (2010) ·Zbl 1411.62142号 ·文件编号:10.1111/j.1467-9868.2010.00740.x
[26] 明绍森,N。;Meier,L。;Bühlmann,P.,高维回归的P值,《美国统计协会期刊》,104,488,1671-1681(2009)·Zbl 1205.62089号 ·doi:10.1198/jasa.2009.tm08647
[27] Minnier,J。;田,L。;Cai,T.,正则回归估计推断的扰动方法,美国统计协会,106,496,1371-1382(2011)·Zbl 1323.62076号 ·doi:10.1198/jasa.2011.tm10382
[28] 密特拉·R。;Zhang,C-H,用去偏倚标度群Lasso,Electron进行群推理时群稀疏性的益处。《J Stat.》,第10、2、1829-1873页(2016年)·Zbl 1397.62261号 ·doi:10.1214/16-EJS1120
[29] Nguyen,T.-B.,Chevalier,J.-A.,Thirion,B.:Ecko:功能磁共振成像数据稳健多元推断的聚类仿冒集成。载:国际医学影像信息处理会议,第454-466页。施普林格(2019)
[30] Nguyen,T.-B.,Chevalier,J.-A.,Thirion,B.,Arlot,S.:多个仿冒品的聚合。摘自:机器学习国际会议,第7283-7293页。PMLR(2020年)
[31] 宁,Y。;Liu,H.,稀疏高维模型假设检验和置信区的一般理论,Ann.Stat.,45,1,158-195(2017)·兹比尔1364.62128 ·doi:10.1214/16-AOS1448
[32] Norman,KA;Polyn,SM;Detre,GJ;Haxby,JV,《超越思维:fMRI数据的多体素模式分析》,《趋势认知》。科学。,10, 9, 424-430 (2006) ·doi:10.1016/j.tics2006.07005
[33] 理查兹,JW;Freeman,体育;Lee,AB;Schafer,CM,利用天文光谱中的低维结构,天体物理学。J.,691,1,32(2009年)·doi:10.1088/0004-637X/691/1/32
[34] Tibshirani,R.,通过Lasso,J.R.Stat.Soc.Ser.回归收缩和选择。B统计方法。,58, 1, 267-288 (1996) ·Zbl 0850.62538号
[35] van de Geer,S。;Bühlmann,P。;Ritov,Y。;Dezeure,R.,《关于高维模型的渐近最优置信区域和检验》,《Ann.Stat.》,42,3,1166-1202(2014)·Zbl 1305.62259号
[36] Varoquaux,G.,Gramfort,A.,Thirion,B.:小样本脑映射:随机和聚类空间相关设计的稀疏恢复。摘自:机器学习国际会议(2012)
[37] Wainwright,MJ,使用(ell_1)约束二次规划(Lasso)恢复高维和噪声稀疏性的夏普阈值,IEEE Trans。图像处理。,55, 5, 2183-2202 (2009) ·Zbl 1367.62220号
[38] Wasserman,L。;Roeder,K.,《高维变量选择》,Ann.Stat.,37,5,2178-2201(2009)·Zbl 1173.62054号 ·doi:10.1214/08-AOS646
[39] 张,C-H;Zhang,SS,高维线性模型中低维参数的置信区间,J.R.Stat.Soc.Ser。B统计方法。,76, 1, 217-242 (2014) ·兹比尔1411.62196 ·doi:10.1111/rssb.12026
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。