×

度量空间值数据的全变差正则化Fréchet回归。 (英语) Zbl 1486.62326号

摘要:在数据应用中,越来越多地遇到使用标量预测器(如时间)索引的非核素数据,而针对此类随机对象的统计方法和理论还没有很好的发展。为了解决这一领域对新方法的需求,我们为非参数Fréchet回归开发了一种全变差正则化技术,这是指一种回归设置,其中驻留在度量空间中的响应与标量预测器成对出现,目标是一个条件Fré)均值。具体地说,我们寻求通过一个估计量来近似未知的度量空间值函数,该估计量最小化Fréchet版本的最小二乘,同时具有较小的总变差,这是对度量空间值对象的适当定义。我们证明了所得到的估计量可用分段常数函数表示,并建立了所提出的估计量对于位于Hadamard空间中的度量数据对象的最小最大收敛速度。我们说明了该方法对模拟数据和实际数据的数值性能,包括具有仿射不变距离的对称正定矩阵的度量空间、具有Wasserstein距离的实线上的概率分布以及具有Billera-Holmes-Vogtmann度量的系统发育树。

MSC公司:

62兰特 度量空间统计
62兰特 歧管统计
62G08号 非参数回归和分位数回归
62甲12 多元分析中的估计
6220国集团 非参数推理的渐近性质
94A08型 信息与通信理论中的图像处理(压缩、重建等)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Afsari,B.(2011)。黎曼重心:存在性、唯一性和凸性。程序。阿默尔。数学。Soc公司。139 655-673. ·Zbl 1220.53040号 ·doi:10.1090/S0002-9939-2010-10541-5
[2] Alquier,P.、Cottet,V.和Lecué,G.(2019年)。具有Lipschitz损失函数的正则化过程的估计界和尖锐预言不等式。安。统计师。47 2117-2144. ·Zbl 1466.62289号 ·doi:10.1214/18-AOS1742
[3] Arsigny,V.、Fillard,P.、Pennec,X.和Ayache,N.(2006年)。扩散张量快速简单计算的对数核素度量。Magn.公司。Reson公司。医学。56 411-421.
[4] Arsigny,V.、Fillard,P.、Pennec,X.和Ayache,N.(2007年)。对称正定矩阵上新型向量空间结构中的几何平均。SIAM J.矩阵分析。申请。29 328-347. ·Zbl 1144.47015号 ·数字对象标识代码:10.1137/050637996
[5] 巴查克,M.(2015)。非正曲率下非线性半群的收敛性。事务处理。阿默尔。数学。Soc公司。367 3929-3953. ·兹比尔1310.58004 ·doi:10.1090/S0002-9947-2015-06087-5
[6] Bergmann,R.和Weinmann,A.(2016)。一种二阶TV型方法,用于修复和去噪高维循环和向量空间组合数据。数学杂志。图像视觉55 401-427. ·Zbl 1338.65155号 ·doi:10.1007/s10851-015-0627-3
[7] Bergmann,R.、Laus,F.、Steidl,G.和Weinmann,A.(2014)。循环数据的二阶差分及其在变分去噪中的应用。SIAM J.成像科学。7 2916-2953. ·Zbl 1309.65022号 ·数字对象标识代码:10.1137/140969993
[8] Bhattacharya,R.和Patrangnaru,V.(2003年)。流形上内、外样本均值的大样本理论。一、。安。统计师。31 1-29. ·Zbl 1020.62026号 ·doi:10.1214/aos/1046294456
[9] Billera,L.J.、Holmes,S.P.和Vogtmann,K.(2001)。系统发育树空间的几何学。申请中的预付款。数学。27 733-767. ·Zbl 0995.92035号 ·doi:10.1006/aama.2001.0759
[10] Bridson,M.R.(1991)。度量单纯形复形中的测地学和曲率。康奈尔大学博士论文·Zbl 0844.53034号
[11] Bridson,M.R.和Haefliger,A.(1999)。非正曲率度量空间.德国数学研究所[数学科学基本原理] 319. 柏林施普林格·Zbl 0988.53001号 ·doi:10.1007/978-3-662-12494-9
[12] Burago,D.、Burago.Y.和Ivanov,S.(2001年)。公制几何课程.数学研究生学习33.阿默尔。数学。意大利普罗维登斯足球俱乐部·Zbl 0981.51016号 ·doi:10.1090/gsm/033
[13] Chambolle,A.、Caselles,V.、Cremers,D.、Novaga,M.和Pock,T.(2010年)。介绍图像分析的总变化。稀疏恢复的理论基础和数值方法.氡序列。计算。申请。数学。9 263-340. 德格鲁伊特,柏林·Zbl 1209.94004号 ·doi:10.1515/9783110226157.263
[14] Chang,T.(1989)。变量有误差的球面回归。安。统计师。17 293-306. ·Zbl 0669.62042号 ·doi:10.1214/aos/1176347017
[15] Chinot,G.、Lecué,G.和Lerasle,M.(2020年)。使用Lipschitz和凸损失函数的鲁棒统计学习。普罗巴伯。理论相关领域176 897-940. ·Zbl 1436.62178号 ·doi:10.1007/s00440-019-00931-3
[16] Cornea,E.、Zhu,H.、Kim,P.和Ibrahim,J.G.(2017)。黎曼对称空间上的回归模型。J.R.统计社会服务。B.统计方法。79 463-482. ·Zbl 1414.62177号 ·doi:10.1111/rssb.12169
[17] Dai,X.和Müller,H.-G.(2018)。黎曼流形和球面上函数数据的主成分分析。安。统计师。46 3334-3361. ·Zbl 1454.62553号 ·doi:10.1214/17-AOS1660
[18] Davis,B.C.、Fletcher,P.T.、Bullitt,E.和Joshi,S.(2010年)。随机设计数据的总体形状回归。国际期刊计算。视觉。90 255-266.
[19] Desikan,R.S.、Ségonne,F.、Fischl,B.、Quinn,B.T.、Dickerson,B.C.、Blacker,D.、Buckner,R.L.、Dale,A.M.、Maguire,R.P.等人(2006年)。一种自动标记系统,用于将MRI扫描的人类大脑皮层细分为感兴趣的回转区域。神经影像31 968-980.
[20] Donoho,D.L.和Johnstone,I.M.(1998年)。基于小波收缩的Minimax估计。安。统计师。26 879-921. ·Zbl 0935.62041号 ·doi:10.1214/aos/1024691081
[21] Dryden,I.L.、Koloydenko,A.和Zhou,D.(2009)。协方差矩阵的非核素统计,应用于扩散张量成像。附录申请。斯达。3 1102-1123. ·Zbl 1196.62063号 ·doi:10.1214/09-AOAS249
[22] Dubey,P.和Müller,H.-G.(2020a)。Fréchet变化点检测。安。统计师。48 3312-3335. ·Zbl 1461.62243号 ·doi:10.1214/19-AOS1930
[23] Dubey,P.和Müller,H.-G.(2020b)。时变随机对象的函数模型。J.R.统计社会服务。B.统计方法。82 275-327. ·Zbl 07554756号
[24] Eltzner,B.和Huckemann,S.F.(2019年)。流形的模糊中心极限定理及其在高维球面上的应用。安。统计师。47 3360-3381. ·Zbl 1436.60032号 ·doi:10.1214/18-AOS1781
[25] Essen,D.C.V.、Smith,S.M.、Barch,D.M.、Behrens,T.E.J.、Yacoub,E.、Ugurbil,K.和Wu-Minn HCP Consortium(2013年)。Wu-Minn人类连接体项目:概述。神经影像80 62-79.
[26] Fang,B.、Guntuboyina,A.和Sen,B.(2021)。通过整体单调性和Hardy-Krause变化对等渗回归和全变差去噪进行多元扩展。安。统计师。49 769-792. ·Zbl 1471.62372号 ·doi:10.1214/20-aos1977
[27] Faraway,J.J.(2014)。使用距离矩阵对非欧几里德数据进行回归。J.应用。斯达。41 2342-2357. ·Zbl 1514.62555号 ·doi:10.1080/02664763.2014.909794
[28] Fillard,P.、Arsigny,V.、Ayache,N.和Pennec,X.(2005)。张量值图像处理的黎曼框架。深层结构、奇点和计算机视觉国际研讨会112-123.
[29] Fisher,N.I.(1995)。循环数据的统计分析剑桥大学出版社,剑桥·Zbl 0788.62047号 ·doi:10.1017/CBO9780511564345
[30] 弗莱彻,P.T.(2013)。黎曼流形上的测地回归和最小二乘理论。国际期刊计算。视觉。105 171-185. ·Zbl 1304.62092号 ·doi:10.1007/s11263-012-0591-y
[31] Fletcher,T.和Joshi,S.(2007年)。扩散张量数据统计分析的黎曼几何。信号处理。87 250-262. ·Zbl 1186.94126号
[32] Friston,K.J.(2011)。功能和有效连接:综述。大脑连接。1 13-36.
[33] Green,M.F.、Horan,W.P.和Lee,J.(2015)。精神分裂症的社会认知。神经科学自然评论。16 620-631.
[34] Hein,M.(2009)。具有度量空间值输出的稳健非参数回归。神经信息处理系统研究进展718-726.
[35] Hinkle,J.、Fletcher,P.T.和Joshi,S.(2014)。黎曼流形上回归的内禀多项式。数学杂志。图像视觉50 32-52. ·Zbl 1310.53038号 ·doi:10.1007/s10851-013-0489-5
[36] Hotz,T.、Huckemann,S.、Le,H.、Marron,J.S.、Mattingly,J.C.、Miller,E.、Nolen,J.、Owen,M.、Patrangenaru,V.等人(2013年)。打开书本上的粘滞中心极限定理。附录申请。普罗巴伯。23 2238-2258. ·Zbl 1293.60006号 ·doi:10.1214/12-AAP899
[37] Hütter,J.-C.和Rigollet,P.(2016)。全变分去噪的最佳速率。29年第届学习理论年会(V.Feldman、A.Rakhlin和O.Shamir编辑)。机器学习研究进展49 1115-1146. PMLR,哥伦比亚大学,美国纽约州纽约市。
[38] Kim,S.-J.、Koh,K.、Boyd,S.和Gorinevsky,D.(2009年)\[{l1}\]趋势过滤。SIAM版本。51 339-360. ·Zbl 1171.37033号 ·doi:10.1137/070690274
[39] Kloeckner,B.(2010年)。瓦瑟斯坦空间的几何研究:欧几里德空间。Ann.Sc.规范。超级的。比萨Cl.Sci. (5) 9 297-323. ·Zbl 1218.53079号
[40] Kolar,M.和Xing,E.P.(2012年)。用跳跃估计网络。电子。J.统计。6 2069-2106. ·Zbl 1295.62032号 ·doi:10.1214/12-EJS739
[41] Ledoux,M.和Talagrand,M.(2011年)。Banach空间中的概率:等周测量和过程.经典数学丛书柏林施普林格·兹比尔1226.60003
[42] Lang,S.(1995)。微分流形和黎曼流形纽约州施普林格·Zbl 0824.58003号
[43] Lellmann,J.、Strekalovskiy,E.、Koetter,S.和Cremers,D.(2013)。流形中具有值的函数的全变差正则化。2013年IEEE国际计算机视觉会议2944-2951. IEEE,纽约。
[44] Lin,Z.(2019)。基于Cholesky分解的对称正定矩阵的黎曼几何。SIAM J.矩阵分析。申请。40 1353-1370. ·Zbl 07141455号 ·doi:10.1137/18M1221084
[45] Lin,Z.和Müller,H.-G.(2021)。补充“度量空间值数据的全变差正则化Fréchet回归”https://doi.org/10.1214/21-AOS2095SUPP网站
[46] Mammen,E.和van de Geer,S.(1997年)。局部自适应回归样条。安。统计师。25 387-413. ·Zbl 0871.62040号 ·doi:10.1214/aos/1034276635
[47] Moakher,M.(2005年)。对称正定矩阵几何平均值的微分几何方法。SIAM J.矩阵分析。申请。26 735-747. ·Zbl 1079.47021号 ·doi:10.1137/S089547979803436937
[48] Ortelli,F.和van de Geer,S.(2018年)。关于一类树图的全变差正则估计。电子。J.统计。12 4517-4570. ·Zbl 1411.62208号 ·doi:10.1214/18-ejs1519
[49] Owen,M.和Provan,J.S.(2011年)。在树空间中计算测地线距离的快速算法。IEEE/ACM传输。计算。生物信息。8 2-13.
[50] Patrangnaru,V.和Ellingson,L.(2015)。流形上的非参数统计及其在对象数据分析中的应用CRC出版社,佛罗里达州博卡拉顿·Zbl 1331.62007号
[51] Pelletier,B.(2006年)。闭黎曼流形上的非参数回归估计。J.非参数。斯达。18 57-67. ·Zbl 1088.62053号 ·doi:10.1080/10485250500504828
[52] Pennec,X.(2018)。流形上的重心子空间分析。安。统计师。46 2711-2746. ·Zbl 1410.60018号 ·doi:10.1214/17-AOS1636
[53] Pennec,X.、Fillard,P.和Ayache,N.(2006年)。张量计算的黎曼框架。国际期刊计算。视觉。66 41-66. ·兹比尔1287.53031
[54] Petersen,A.和Müller,H.-G.(2016)。多元函数数据可解释协方差的Fréchet积分和自适应度量选择。生物特征103 103-120. ·Zbl 1452.62400 ·doi:10.1093/biomet/asv054
[55] Petersen,A.和Müller,H.-G.(2019年)。具有欧几里德预测因子的随机对象的Fréchet回归。安。统计师。47 691-719. ·Zbl 1417.62091号 ·doi:10.1214/17-AOS1624
[56] Petrunin,A.和Tuschmann,W.(1999)。Diffeomorphism有限性,正箍缩,和第二同伦论。地理。功能。分析。9 736-774. ·Zbl 0941.53026号 ·doi:10.1007/s000390050101
[57] Rathi,Y.、Tannenbaum,A.和Michailovich,O.(2007)。张量流形上的图像分割。2007年计算机视觉和模式识别大会上1-8. IEEE,纽约。
[58] Rudin,L.I.、Osher,S.和Fatemi,E.(1992年)。基于非线性全变分的噪声去除算法。物理学。D、 非线性现象。60 259-268. ·Zbl 0780.49028号 ·doi:10.1016/0167-2789(92)90242-F
[59] Sacks,J.和Ylvisaker,D.(1970年)。设计具有相关误差的回归问题。三、。安。数学。斯达。41 2057-2074. ·Zbl 0234.62025号 ·doi:10.1214/aoms/1177696705
[60] Sadhanala,V.、Wang,Y.-X.和Tibshirani,R.J.(2016)。1d以上的总变化等级:最小最大速率,以及线性平滑器的限制。神经信息处理系统3521-3529.
[61] Shi,X.,Styner,M.,Lieberman,J.,Ibrahim,J.G.,Lin,W.和Zhu,H.(2009)。流形值数据的内在回归模型。医学图像计算和计算机辅助干预-MICCAI12 192-199.
[62] Steinke,F.、Hein,M.和Schölkopf,B.(2010年)。一般黎曼流形之间的非参数回归。SIAM J.成像科学。3 527-563. ·Zbl 1195.41011号 ·doi:10.1137/080744189
[63] Strong,D.和Chan,T.(2003年)。全变分正则化的边保持和尺度相关性质。反向探测。19 S165-S187·Zbl 1043.94512号 ·doi:10.1088/0266-5611/19/6/059
[64] Sturm,K.-T.(2003)。非正曲率度量空间上的概率测度。热核与流形、图和度量空间的分析(巴黎, 2002).康斯坦普。数学。338 357-390. 阿默尔。数学。意大利普罗维登斯足球俱乐部·Zbl 1040.60002号 ·doi:10.1090/conm/338/06080
[65] Tibshirani,R.J.(2014)。通过趋势滤波进行自适应分段多项式估计。安。统计师。42 285-323. ·Zbl 1307.62118号 ·doi:10.1214/13-AOS1189
[66] Tibshirani,R.、Saunders,M.、Rosset,S.、Zhu,J.和K.奈特(2005)。通过融合套索实现轻盈流畅。J.R.统计社会服务。B.统计方法。67 91-108. ·Zbl 1060.62049号 ·文件编号:10.1111/j.1467-9868.2005.00490.x
[67] van de Geer,S.(1990)。估计回归函数。安。统计师。18 907-924. ·Zbl 0709.62040号 ·doi:10.1214/aos/1176347632
[68] van de Geer,S.(2001)。具有复杂度惩罚的最小二乘估计。数学。方法统计。10 355-374. ·Zbl 1005.62043号
[69] Wang,X.、Zhu,H.和ADNI(2017)。通过总变差的广义标度图像回归模型。J.Amer。统计师。协会。112 1156-1168. ·doi:10.1080/01621459.2016年11月94846日
[70] Wang,Y.-X.、Sharpnack,J.、Smola,A.J.和Tibshirani,R.J.(2016)。对图形进行趋势筛选。J.马赫。学习。物件。17第105号论文,41页·Zbl 1369.62082号
[71] Weinmann,A.、Demaret,L.和Storath,M.(2014)。流形值数据的全变分正则化。SIAM J.成像科学。7 2226-2257. ·Zbl 1309.65071号 ·数字对象标识代码:10.1137/130951075
[72] Yuan,Y.、Zhu,H.、Lin,W.和Marron,J.S.(2012)。对称正定矩阵的局部多项式回归。J.R.统计社会服务。B.统计方法。74 697-719. ·Zbl 1411.62110号 ·doi:10.1111/j.1467-9868.2011.01022.x号文件
[73] Zhou,D.、Dryden,I.L.、Koloydenko,A.A.、Audenaert,K.M.R.和Bai,L.(2016)。使用非欧几里德统计对扩散张量图像进行正则化、插值和可视化。J.应用。斯达。43 943-978. ·兹比尔1514.62982 ·doi:10.1080/02664763.2015.1080671
[74] Zhu,H.,Fan,J.和Kong,L.(2014)。具有跳跃不连续性的神经影像数据的空间变系数模型。J.Amer。统计师。协会。109 1084-1098 ·Zbl 1368.62297号 ·doi:10.1080/01621459.2014.881742
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。