×

最优可达估计和度量学习。 (英语) Zbl 07732740号

总结:我们研究了达到流形估计和几何数据分析中普遍存在的正则参数。给定(mathbb{R}^d)的未知(d)维(mathcal{C}^k)-光滑子流形(M)上的i.i.d.样本,我们为估计其可达性提供了最佳的非共振界。我们一方面建立了以最大曲率和测地线畸变表示的河段公式。导出的速率是自适应的,速率取决于\(M\)的范围是来自曲率还是来自瓶颈结构。在此过程中,我们导出了最优测地线度量估计界。

MSC公司:

62兰特 歧管统计
62G05型 非参数估计
62C20个 统计决策理论中的Minimax过程
62H11型 定向数据;空间统计学
68单位05 计算机图形;计算几何(数字和算法方面)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] AAMARI,E.、AARON,C.和LEVRARD,C.(2021)。Minimax边界估计和带边界估计。预打印。可从arXiv:2108.03135获取·Zbl 1419.62130号
[2] AAMARI,E.、BERENFELD,C.和LEVRARD,C.(2023)。“最优到达估计和度量学习”的补充https://doi.org/10.1214/23-AOS2281SUPP网站 ·Zbl 07732740号
[3] AAMARI,E.、KIM,J.、CHAZAL,F.、MICHEL,B.、RINALDO,A.和WASSERMAN,L.(2019)。估计流形的范围。电子。J.统计。13 1359-1399. ·Zbl 1418.62100号 ·doi:10.1214/19-ejs1551
[4] Aamari,E.和Levrard,C.(2019年)。流形、切空间和曲率估计的非渐近速率。安。统计师。47 177-204. ·Zbl 1419.62130号 ·doi:10.1214/18-AOS1685
[5] AIZENBUD,Y.和SOBER,B.(2021)。基于噪声数据的流形非参数估计。预印本。可从arXiv:2105.04754获得·Zbl 1458.62327号
[6] ARIAS-CASTRO,E.和CHAU,P.A.(2020年)。曲面上距离的极小极大估计和等距到凸设置中的极小极大流形学习。预印本。arXiv:2011.2478提供。
[7] ARIAS CASTRO,E.和LE GOUIC,T.(2019年)。无约束和曲率约束的最短路径距离及其近似值。离散计算。地理。62 1-28. ·Zbl 1418.53045号 ·doi:10.1007/s00454-019-00060-7
[8] ARIAS CASTRO,E.和PELLETIER,B.(2013)。关于最大方差展开的收敛性。J.马赫。学习。物件。14 1747-1770. ·Zbl 1318.62125号
[9] ATTALI,D.、LIEUTIER,A.和SALINAS,D.(2013)。Vietoris-Rips复合体还提供了采样形状的拓扑正确重建。计算。地理。46 448-465. ·Zbl 1262.68171号 ·doi:10.1016/j.comgeo.2012.02.009
[10] BALAKRISHNAN,S.、RINALDO,A.、SHEEHY,D.、SINGH,A.和WASSERMAN,L.(2012)。同源推理的最小最大速率。第十五届国际人工智能与统计会议记录(N.D.Lawrence和M.Girolma编辑)。机器学习研究进展22 64-72. 加那利群岛拉帕尔马PMLR。
[11] BERENFELD,C.、HARVEY,J.、HOFFMANN,M.和SHANKAR,K.(2022年)。通过凸性缺陷函数估计流形的可达性。离散计算。地理。67 403-438. ·Zbl 07493729号 ·doi:10.1007/s00454-021-00290-8
[12] BOISSONNAT,J.-D.和GHOSH,A.(2014)。使用切向Delaunay复合体重建流形。离散计算。地理。51 221-267. ·Zbl 1312.68209号 ·doi:10.1007/s00454-013-9557-2
[13] BOISSONNAT,J.-D.,LIEUTIER,A.和WINTRAECKEN,M.(2019年)。可达性、度量失真、测地凸性和切线空间的变化。J.应用。计算。白杨。3 29-58. ·Zbl 1431.53043号 ·doi:10.1007/s41468-019-00029-8
[14] Bourgain,J.(1985)。关于Hilbert空间中有限度量空间的Lipschitz嵌入。以色列J.数学。52 46-52. ·Zbl 0657.46013号 ·doi:10.1007/BF02776078
[15] CHATPATANASIRI,R.、KORSRILABUTR,T.、TANGCHANACHAIANAN,P.和KIJSIRIKUL,B.(2010)。一种新的马氏距离学习算法内核化框架。神经计算73 1570-1579.
[16] CHAZAL,F.、COHEN-STEINER,D.和LIEUTIER,A.(2006)。欧氏空间中紧集的抽样理论。计算几何(SCG公司06) 319-326. 纽约ACM·Zbl 1153.68525号 ·数字对象标识代码:10.1145/1137856.1137904
[17] Chazal,F.、Cohen-Steiner,D.和Mérigot,Q.(2011年)。概率测度的几何推理。已找到。计算。数学。11 733-751. ·Zbl 1230.62074号 ·doi:10.1007/s10208-011-9098-0
[18] CHAZAL,F.、GLISSE,M.、LABRUÈRE,C.和MICHEL,B.(2014)。拓扑数据分析中持久图估计的收敛速度。会议记录31第一届国际机器学习会议(E.P.Xing和T.Jebara编辑)。机器学习研究论文集32 163-171. PMLR,中国北京·Zbl 1351.62009年
[19] CHAZAL,F.和LIEUTIER,A.(2005年)。“(λ)-中轴”。图表。模型67 304-331. ·Zbl 1175.68487号 ·doi:10.1016/j.gmod.2005.01.002
[20] CHAZAL,F.和MICHEL,B.(2021)。拓扑数据分析简介:数据科学家的基本和实用方面。前面。Artif公司。智力。4 667963. ·doi:10.3389/frai.2021.667963
[21] CHENNUR VANKADARA,L.和VON LUXBURG,U.(2018年)。机器学习的失真度量。高级神经信息处理。系统。31
[22] CHOLAQUIDIS,A.、FRAIMAN,R.和MORENO,L.(2023)。河段的普遍一致估计。J.统计。计划。推断225 110-120. ·Zbl 1512.62104号 ·doi:10.1016/j.jspi.2022.11.007
[23] CLARKE,F.H.、STERN,R.J.和WOLENSKI,P.R.(1995)。近似平滑度和较低的-\(\mathit{C}^2)属性。J.凸面分析。2 117-144. ·Zbl 0881.49008号
[24] 考克斯,M.A.和考克斯,T.F.(2008)。多维缩放。数据可视化手册315-347. 柏林施普林格·兹比尔1147.68460
[25] DIVOL,V.(2021)。流形推理中的Minimax自适应估计。电子。J.统计。15 5888-5932. ·Zbl 1493.62162号 ·doi:10.1214/21-ejs1934
[26] 费德尔(FEDERER,H.)(1959年)。曲率测量。事务处理。阿默尔。数学。Soc公司。93 418-491. ·Zbl 0089.38402号 ·doi:10.307/1993504
[27] FEFFERMAN,C.、IVANOV,S.、LASSAS,M.和NARAYANAN,H.(2019年)。将大范围的流形拟合到噪声数据。预印。arXiv:1910.05084提供。
[28] GARCíA TRILLOS,N.、SANZ-ALONSO,D.和YANG,R.(2019年)。噪声点云的局部正则化:改进的全局几何估计和数据分析。J.马赫。学习。物件。20第136号论文,37页·Zbl 1434.68407号
[29] GENOVESE,C.R.、PERONE-PACIFICO,M.、VERDINELLI,I.和WASSERMAN,L.(2012)。Minimax流形估计。J.马赫。学习。物件。13 1263-1291. ·Zbl 1283.62112号
[30] GENOVESE,C.R.、PERONE-PACIFICO,M.、VERDINELLI,I.和WASSERMAN,L.(2012)。Hausdorff损失下的流形估计和奇异反褶积。安。统计师。40 941-963. ·Zbl 1274.62237号 ·doi:10.1214/12-AOS994
[31] GLOBERSON,A.和ROWEIS,S.(2005)。通过分解课堂进行量度学习。高级神经信息处理。系统。18
[32] GUILLAUMIN,M.、VERBEEK,J.和SCHMID,C.(2009年)。是你吗?人脸识别的度量学习方法。2009年电气与电子工程师协会12第十届国际计算机视觉会议498-505. IEEE,纽约。
[33] HINTON,G.E.和ROWEIS,S.(2002)。随机邻域嵌入。高级神经信息处理。系统。15
[34] KIM,A.K.H.和ZHOU,H.H.(2015)。Hausdorff损失下流形估计的紧极小极大速率。电子。J.统计。9 1562-1582. ·Zbl 1325.62111号 ·doi:10.1214/15-EJS1039
[35] KWOK,J.T.和TSANG,I.W.(2003)。用理想化的内核学习。会议记录20第十届国际机器学习会议(ICML公司-03) 400-407.
[36] NGUYEN,B.、MORELL,C.和DE BAETS,B.(2017年)。通过最大化Jeffrey发散度监督距离度量学习。模式识别。64 215-225. ·Zbl 1429.68235号
[37] POLIQUIN,R.A.、ROCKAFELLAR,R.T.和THIBAULT,L.(2000)。距离函数的局部可微性。事务处理。阿默尔。数学。Soc公司。352 5231-5249. ·Zbl 0960.49018号 ·doi:10.1090/S0002-9947-00-02550-2
[38] PUCHKIN,N.和SPOKOINY,V.(2022)。结构自适应流形估计。J.马赫。学习。物件。23第40号论文,62页·Zbl 07625193号
[39] SUáREZ,J.L.、GARCíA,S.和HERRERA,F.(2021)。远程测量学习教程:数学基础、算法、实验分析、前景和挑战。神经计算425 300-322.
[40] Tenenbaum,J.B.、de Silva,V.和Langford,J.C.(2000)。非线性降维的全局几何框架。科学类290 2319-2323.
[41] WASSERMAN,L.(2018)。拓扑数据分析。每年。修订状态申请。5 501-535. ·doi:10.1146/annurev-statistics-031017-100045
[42] XING,E.、JORDAN,M.、RUSSELL,S.J.和NG,A.(2002)。远程度量学习及其在附带信息聚类中的应用。高级神经信息处理。系统。15
[43] YANG,L.和JIN,R.(2006)。远程测量学习:一项综合调查。密歇根州立大学。2 4
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。