埃迪·阿马利;Clément贝伦菲尔德;克莱门·列夫拉德 最优可达估计和度量学习。 (英语) Zbl 07732740号 Ann.统计。 51,第3期,1086-1108(2023). 总结:我们研究了达到流形估计和几何数据分析中普遍存在的正则参数。给定(mathbb{R}^d)的未知(d)维(mathcal{C}^k)-光滑子流形(M)上的i.i.d.样本,我们为估计其可达性提供了最佳的非共振界。我们一方面建立了以最大曲率和测地线畸变表示的河段公式。导出的速率是自适应的,速率取决于\(M\)的范围是来自曲率还是来自瓶颈结构。在此过程中,我们导出了最优测地线度量估计界。 引用于1文件 MSC公司: 62兰特 歧管统计 62G05型 非参数估计 62C20个 统计决策理论中的Minimax过程 62H11型 定向数据;空间统计学 68单位05 计算机图形;计算几何(数字和算法方面) 关键词:几何推理;达到;流形学习;度量学习;最小最大风险 PDF格式BibTeX公司 XML格式引用 \textit{E.Aamari}等人,Ann.Stat.51,No.3,1086--1108(2023;Zbl 07732740) 全文: DOI程序 arXiv公司 链接 参考文献: [1] AAMARI,E.、AARON,C.和LEVRARD,C.(2021)。Minimax边界估计和带边界估计。预打印。可从arXiv:2108.03135获取·Zbl 1419.62130号 [2] AAMARI,E.、BERENFELD,C.和LEVRARD,C.(2023)。“最优到达估计和度量学习”的补充https://doi.org/10.1214/23-AOS2281SUPP网站 ·Zbl 07732740号 [3] AAMARI,E.、KIM,J.、CHAZAL,F.、MICHEL,B.、RINALDO,A.和WASSERMAN,L.(2019)。估计流形的范围。电子。J.统计。13 1359-1399. ·Zbl 1418.62100号 ·doi:10.1214/19-ejs1551 [4] Aamari,E.和Levrard,C.(2019年)。流形、切空间和曲率估计的非渐近速率。安。统计师。47 177-204. ·Zbl 1419.62130号 ·doi:10.1214/18-AOS1685 [5] AIZENBUD,Y.和SOBER,B.(2021)。基于噪声数据的流形非参数估计。预印本。可从arXiv:2105.04754获得·Zbl 1458.62327号 [6] ARIAS-CASTRO,E.和CHAU,P.A.(2020年)。曲面上距离的极小极大估计和等距到凸设置中的极小极大流形学习。预印本。arXiv:2011.2478提供。 [7] ARIAS CASTRO,E.和LE GOUIC,T.(2019年)。无约束和曲率约束的最短路径距离及其近似值。离散计算。地理。62 1-28. ·Zbl 1418.53045号 ·doi:10.1007/s00454-019-00060-7 [8] ARIAS CASTRO,E.和PELLETIER,B.(2013)。关于最大方差展开的收敛性。J.马赫。学习。物件。14 1747-1770. ·Zbl 1318.62125号 [9] ATTALI,D.、LIEUTIER,A.和SALINAS,D.(2013)。Vietoris-Rips复合体还提供了采样形状的拓扑正确重建。计算。地理。46 448-465. ·Zbl 1262.68171号 ·doi:10.1016/j.comgeo.2012.02.009 [10] BALAKRISHNAN,S.、RINALDO,A.、SHEEHY,D.、SINGH,A.和WASSERMAN,L.(2012)。同源推理的最小最大速率。在第十五届国际人工智能与统计会议记录(N.D.Lawrence和M.Girolma编辑)。机器学习研究进展22 64-72. 加那利群岛拉帕尔马PMLR。 [11] BERENFELD,C.、HARVEY,J.、HOFFMANN,M.和SHANKAR,K.(2022年)。通过凸性缺陷函数估计流形的可达性。离散计算。地理。67 403-438. ·Zbl 07493729号 ·doi:10.1007/s00454-021-00290-8 [12] BOISSONNAT,J.-D.和GHOSH,A.(2014)。使用切向Delaunay复合体重建流形。离散计算。地理。51 221-267. ·Zbl 1312.68209号 ·doi:10.1007/s00454-013-9557-2 [13] BOISSONNAT,J.-D.,LIEUTIER,A.和WINTRAECKEN,M.(2019年)。可达性、度量失真、测地凸性和切线空间的变化。J.应用。计算。白杨。3 29-58. ·Zbl 1431.53043号 ·doi:10.1007/s41468-019-00029-8 [14] Bourgain,J.(1985)。关于Hilbert空间中有限度量空间的Lipschitz嵌入。以色列J.数学。52 46-52. ·Zbl 0657.46013号 ·doi:10.1007/BF02776078 [15] CHATPATANASIRI,R.、KORSRILABUTR,T.、TANGCHANACHAIANAN,P.和KIJSIRIKUL,B.(2010)。一种新的马氏距离学习算法内核化框架。神经计算73 1570-1579. [16] CHAZAL,F.、COHEN-STEINER,D.和LIEUTIER,A.(2006)。欧氏空间中紧集的抽样理论。在计算几何(SCG公司06) 319-326. 纽约ACM·Zbl 1153.68525号 ·数字对象标识代码:10.1145/1137856.1137904 [17] Chazal,F.、Cohen-Steiner,D.和Mérigot,Q.(2011年)。概率测度的几何推理。已找到。计算。数学。11 733-751. ·Zbl 1230.62074号 ·doi:10.1007/s10208-011-9098-0 [18] CHAZAL,F.、GLISSE,M.、LABRUÈRE,C.和MICHEL,B.(2014)。拓扑数据分析中持久图估计的收敛速度。在会议记录31第一届国际机器学习会议(E.P.Xing和T.Jebara编辑)。机器学习研究论文集32 163-171. PMLR,中国北京·Zbl 1351.62009年 [19] CHAZAL,F.和LIEUTIER,A.(2005年)。“(λ)-中轴”。图表。模型67 304-331. ·Zbl 1175.68487号 ·doi:10.1016/j.gmod.2005.01.002 [20] CHAZAL,F.和MICHEL,B.(2021)。拓扑数据分析简介:数据科学家的基本和实用方面。前面。Artif公司。智力。4 667963. ·doi:10.3389/frai.2021.667963 [21] CHENNUR VANKADARA,L.和VON LUXBURG,U.(2018年)。机器学习的失真度量。高级神经信息处理。系统。31 [22] CHOLAQUIDIS,A.、FRAIMAN,R.和MORENO,L.(2023)。河段的普遍一致估计。J.统计。计划。推断225 110-120. ·Zbl 1512.62104号 ·doi:10.1016/j.jspi.2022.11.007 [23] CLARKE,F.H.、STERN,R.J.和WOLENSKI,P.R.(1995)。近似平滑度和较低的-\(\mathit{C}^2)属性。J.凸面分析。2 117-144. ·Zbl 0881.49008号 [24] 考克斯,M.A.和考克斯,T.F.(2008)。多维缩放。在数据可视化手册315-347. 柏林施普林格·兹比尔1147.68460 [25] DIVOL,V.(2021)。流形推理中的Minimax自适应估计。电子。J.统计。15 5888-5932. ·Zbl 1493.62162号 ·doi:10.1214/21-ejs1934 [26] 费德尔(FEDERER,H.)(1959年)。曲率测量。事务处理。阿默尔。数学。Soc公司。93 418-491. ·Zbl 0089.38402号 ·doi:10.307/1993504 [27] FEFFERMAN,C.、IVANOV,S.、LASSAS,M.和NARAYANAN,H.(2019年)。将大范围的流形拟合到噪声数据。预印。arXiv:1910.05084提供。 [28] GARCíA TRILLOS,N.、SANZ-ALONSO,D.和YANG,R.(2019年)。噪声点云的局部正则化:改进的全局几何估计和数据分析。J.马赫。学习。物件。20第136号论文,37页·Zbl 1434.68407号 [29] GENOVESE,C.R.、PERONE-PACIFICO,M.、VERDINELLI,I.和WASSERMAN,L.(2012)。Minimax流形估计。J.马赫。学习。物件。13 1263-1291. ·Zbl 1283.62112号 [30] GENOVESE,C.R.、PERONE-PACIFICO,M.、VERDINELLI,I.和WASSERMAN,L.(2012)。Hausdorff损失下的流形估计和奇异反褶积。安。统计师。40 941-963. ·Zbl 1274.62237号 ·doi:10.1214/12-AOS994 [31] GLOBERSON,A.和ROWEIS,S.(2005)。通过分解课堂进行量度学习。高级神经信息处理。系统。18 [32] GUILLAUMIN,M.、VERBEEK,J.和SCHMID,C.(2009年)。是你吗?人脸识别的度量学习方法。2009年电气与电子工程师协会12第十届国际计算机视觉会议498-505. IEEE,纽约。 [33] HINTON,G.E.和ROWEIS,S.(2002)。随机邻域嵌入。高级神经信息处理。系统。15 [34] KIM,A.K.H.和ZHOU,H.H.(2015)。Hausdorff损失下流形估计的紧极小极大速率。电子。J.统计。9 1562-1582. ·Zbl 1325.62111号 ·doi:10.1214/15-EJS1039 [35] KWOK,J.T.和TSANG,I.W.(2003)。用理想化的内核学习。在会议记录20第十届国际机器学习会议(ICML公司-03) 400-407. [36] NGUYEN,B.、MORELL,C.和DE BAETS,B.(2017年)。通过最大化Jeffrey发散度监督距离度量学习。模式识别。64 215-225. ·Zbl 1429.68235号 [37] POLIQUIN,R.A.、ROCKAFELLAR,R.T.和THIBAULT,L.(2000)。距离函数的局部可微性。事务处理。阿默尔。数学。Soc公司。352 5231-5249. ·Zbl 0960.49018号 ·doi:10.1090/S0002-9947-00-02550-2 [38] PUCHKIN,N.和SPOKOINY,V.(2022)。结构自适应流形估计。J.马赫。学习。物件。23第40号论文,62页·Zbl 07625193号 [39] SUáREZ,J.L.、GARCíA,S.和HERRERA,F.(2021)。远程测量学习教程:数学基础、算法、实验分析、前景和挑战。神经计算425 300-322. [40] Tenenbaum,J.B.、de Silva,V.和Langford,J.C.(2000)。非线性降维的全局几何框架。科学类290 2319-2323. [41] WASSERMAN,L.(2018)。拓扑数据分析。每年。修订状态申请。5 501-535. ·doi:10.1146/annurev-statistics-031017-100045 [42] XING,E.、JORDAN,M.、RUSSELL,S.J.和NG,A.(2002)。远程度量学习及其在附带信息聚类中的应用。高级神经信息处理。系统。15 [43] YANG,L.和JIN,R.(2006)。远程测量学习:一项综合调查。密歇根州立大学。2 4 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。