文件Zbl 1496.62008-zbMATH Open

高维线性模型的空间松弛推理。（英语） Zbl 1496.62008年

统计计算。 32，第5号，第83号论文，第15页（2022年）.

摘要：当协变量在其相关性中具有潜在的空间组织时，我们考虑高维线性模型的推理问题。这种设置的典型示例是高分辨率成像，其中相邻像素通常非常相似。在这种情况下，如果协变量比样本多，而且协变量之间相关性高，则不可能进行精确的点和置信区间估计。这要求重新制定统计推断问题，并考虑到潜在的空间结构：如果协变量是局部相关的，则可以在给定的空间不确定性范围内检测它们。因此，我们建议依赖（delta）-FWER，也就是说，在距离任何真正的距离大于（delta。考虑到这一目标度量，我们研究了集成聚类推理算法的特性，这些算法结合了三种技术：空间约束聚类、统计推理和集成来聚合多个聚类推理解决方案。我们证明，在标准假设下，集成聚类推理算法控制着（delta）-FWER，因为（delta”）等于最大聚类直径。我们用实证结果补充了理论分析，证明了这种推理算法可以实现精确的（delta）-FWER控制和可观的功率。

MSC公司：

62-08	统计问题的计算方法
62J05型	线性回归；混合模型
62J07型	岭回归；收缩估计器（拉索）
62甲12	多元分析中的估计

关键词：

群集;高维;线性模型;空间公差;统计推断;结构化数据;支持恢复

软件：

博拉索;dSTEM公司;cov测试;BALD公司

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司哈尔

参考文献：

[1]	巴赫，F.R.：博拉索：通过bootstrap进行模型一致的拉索估计。载：《第25届国际机器学习大会论文集》，第33-40页（2008年）
[2]	理发师，RF；Candès，E.，《通过仿冒品控制虚假发现率》，《Ann.Stat.》，第43、5、2055-2085页（2015年）·Zbl 1327.62082号 ·doi:10.1214/15-AOS1337
[3]	PC公司Bellec；Zhang，C-H，用自由度调节来消除拉索的偏置，伯努利，28，27113-743（2022）·Zbl 07526563号 ·doi:10.3150/21-BEJ1348
[4]	伯克，R。；布朗，L。；Buja，A。；张凯。；Zhao，L.，有效的后选择推理，Ann.Stat.，41，2，802-837（2013）·兹比尔1267.62080 ·doi:10.1214/12-AOS1077
[5]	布兰查德，G。；Geman，D.，模式识别的层次测试设计，Ann.Stat.，33，3，1155-1202（2005）·Zbl 1072.62052号 ·doi:10.1214/009053605000000174
[6]	Bühlmann，P.，《高维线性模型的统计意义》，伯努利，19，4，1212-1242（2013）·Zbl 1273.62173号 ·doi:10.3150/12-BEJSP11
[7]	Bühlmann，P。；Rütimann，P。；van de Geer，S。；Zhang，C-H，回归中的相关变量：聚类和稀疏估计，J.Stat.Plan。推理，143，11，1835-1858（2013）·Zbl 1278.62103号 ·doi:10.1016/j.jspi.2013.05.019
[8]	Candès，E.，Fan，Y.，Janson，L.，Lv，J.：淘金：高维受控变量选择的“X型”仿制品。J.R.统计社会服务。B统计方法。80(3), 551-577 (2018) ·Zbl 1398.62335号
[9]	查特吉，A。；Lahiri，SN，Bootstrapping Lasso estimators，美国统计协会，106，494，608-625（2011）·Zbl 1232.62088号 ·doi:10.1198/jasa.2011.tm10159
[10]	Cheng，D。；何，Z。；Schwartzman，A.，检测变化点的局部极值多重测试，电子。J.Stat.，第14、2、3705-3729页（2020年）·兹比尔1452.62623 ·doi:10.1214/20-EJS1751
[11]	Chevalier，J.-A.，Salmon，J.，Thirion，B.：用集群去散化拉索集合进行统计推断。摘自：医学图像计算和计算机辅助干预国际会议，第638-646页。施普林格（2018）
[12]	骑士，J-A；Gramfort，A。；沙门，J。；Thirion，B.，用解量化多任务Lasso进行时空MEG/EEG源成像的统计控制，高级神经信息处理。系统。，33, 1759-1770 (2020)
[13]	Chevalier，J.-A.，Nguyen，T.-B.，Salmon，J.，Varoqueux，G.，Thirion，B.：自信解码：解码器映射的统计控制。神经影像学117921（2021）
[14]	Dehman，A。；安布罗斯，C。；Neuvial，P.，利用连锁不平衡信息进行变量选择的分块方法的性能，BMC生物信息。，16148（2015年）·doi:10.1186/s12859-015-0556-6
[15]	Dezeure，R。；Bühlmann，P。；Meier，L。；Meinshausen，N.，《高维推断：置信区间，（p\）-值和R软件hdi》，《统计科学》。，30, 4, 533-558 (2015) ·Zbl 1426.62183号 ·doi:10.1214/15-STS527
[16]	OJ Dunn，《均值之间的多重比较》，《美国统计协会期刊》，56，293，52-64（1961）·Zbl 0103.37001号 ·doi:10.1080/01621459.1961.10482090
[17]	Gimenez，J.R.，Zou，J.：发现具有统计保证的条件显著特征。摘自：机器学习国际会议，第2290-2298页（2019年）
[18]	Hoyos-Idrobo，A。；瓦罗佐，G。；Kahn，J。；Thirion，B.，递归最近凝聚（ReNA）：结构信号近似的快速聚类，IEEE Trans。模式分析。机器。智力。，41, 3, 669-681 (2018) ·doi:10.1109/TPAMI.2018.2815524
[19]	Janson，L。；Su，W.，《通过仿冒品实现家庭差错率控制》，Electron。J.Stat.，10，1，960-975（2016）·Zbl 1341.62245号 ·doi:10.1214/16-EJS1129
[20]	爪哇马德，A。；Montanari，A.，高维回归的置信区间和假设检验，J.马赫。学习。第15号决议，2869-2909（2014年）·Zbl 1319.62145号
[21]	爪哇马德，A。；Montanari，A.，Debising the Lasso：高斯设计的最佳样本量，《美国统计年鉴》，46，6，2593-2622（2018）·Zbl 1407.62270号 ·doi:10.1214/17-AOS1630
[22]	罗克哈特。；泰勒，J。；RJ Tibshirani；Tibshirani，R.，《拉索的显著性检验》，Ann.Stat.，42，2，413（2014）·Zbl 1305.62254号
[23]	Meinshausen，N.，《可变重要性的层次测试》，《生物统计学》，95，2，265-278（2008）·兹比尔1437.62557 ·doi:10.1093/biomet/asn007
[24]	Meinshausen，N:。组界：稀疏高维回归中变量组的置信区间，无需对设计进行假设。J.R.统计社会服务。B统计方法。923-945 (2015) ·Zbl 1414.62060号
[25]	明绍森，N。；Bühlmann，P.，稳定性选择，J.R.Stat.Soc.Ser。B统计方法。，72, 417-473 (2010) ·Zbl 1411.62142号 ·文件编号：10.1111/j.1467-9868.2010.00740.x
[26]	明绍森，N。；Meier，L。；Bühlmann，P.，高维回归的P值，《美国统计协会期刊》，104，488，1671-1681（2009）·Zbl 1205.62089号 ·doi:10.1198/jasa.2009.tm08647
[27]	Minnier，J。；田，L。；Cai，T.，正则回归估计推断的扰动方法，美国统计协会，106，496，1371-1382（2011）·Zbl 1323.62076号 ·doi:10.1198/jasa.2011.tm10382
[28]	密特拉·R。；Zhang，C-H，用去偏倚标度群Lasso，Electron进行群推理时群稀疏性的益处。《J Stat.》，第10、2、1829-1873页（2016年）·Zbl 1397.62261号 ·doi:10.1214/16-EJS1120
[29]	Nguyen，T.-B.，Chevalier，J.-A.，Thirion，B.：Ecko：功能磁共振成像数据稳健多元推断的聚类仿冒集成。载：国际医学影像信息处理会议，第454-466页。施普林格（2019）
[30]	Nguyen，T.-B.，Chevalier，J.-A.，Thirion，B.，Arlot，S.：多个仿冒品的聚合。摘自：机器学习国际会议，第7283-7293页。PMLR（2020年）
[31]	宁，Y。；Liu，H.，稀疏高维模型假设检验和置信区的一般理论，Ann.Stat.，45，1，158-195（2017）·兹比尔1364.62128 ·doi:10.1214/16-AOS1448
[32]	Norman，KA；Polyn，SM；Detre，GJ；Haxby，JV，《超越思维：fMRI数据的多体素模式分析》，《趋势认知》。科学。，10, 9, 424-430 (2006) ·doi:10.1016/j.tics2006.07005
[33]	理查兹，JW；Freeman，体育；Lee，AB；Schafer，CM，利用天文光谱中的低维结构，天体物理学。J.，691，1，32（2009年）·doi:10.1088/0004-637X/691/1/32
[34]	Tibshirani，R.，通过Lasso，J.R.Stat.Soc.Ser.回归收缩和选择。B统计方法。，58, 1, 267-288 (1996) ·Zbl 0850.62538号
[35]	van de Geer，S。；Bühlmann，P。；Ritov，Y。；Dezeure，R.，《关于高维模型的渐近最优置信区域和检验》，《Ann.Stat.》，42，3，1166-1202（2014）·Zbl 1305.62259号
[36]	Varoquaux，G.，Gramfort，A.，Thirion，B.：小样本脑映射：随机和聚类空间相关设计的稀疏恢复。摘自：机器学习国际会议（2012）
[37]	Wainwright，MJ，使用（ell_1）约束二次规划（Lasso）恢复高维和噪声稀疏性的夏普阈值，IEEE Trans。图像处理。，55, 5, 2183-2202 (2009) ·Zbl 1367.62220号
[38]	Wasserman，L。；Roeder，K.，《高维变量选择》，Ann.Stat.，37，5，2178-2201（2009）·Zbl 1173.62054号 ·doi:10.1214/08-AOS646
[39]	张，C-H；Zhang，SS，高维线性模型中低维参数的置信区间，J.R.Stat.Soc.Ser。B统计方法。，76, 1, 217-242 (2014) ·兹比尔1411.62196 ·doi:10.1111/rssb.12026

此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配，并且可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	综述，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	括号

示例

领域

操作员

高维线性模型的空间松弛推理。（英语） Zbl 1496.62008年

MSC公司：

关键词：

软件：

参考文献：

示例

领域

操作员

高维线性模型的空间松弛推理。 （英语） Zbl 1496.62008年

MSC公司：

关键词：

软件：

参考文献：

高维线性模型的空间松弛推理。（英语） Zbl 1496.62008年