×

稳健几何推理的收敛速度。 (英语) Zbl 1347.62055号

摘要:紧集距离在拓扑数据分析领域中被广泛用于从点云推断几何和拓扑特征。在这种情况下,到概率测度(DTM)的距离由F.查扎尔等【发现计算数学11,No.6,733–751(2011;Zbl 1230.62074号)]作为距离紧集的稳健替代。在实践中,DTM可以通过其经验对应物来估计,即到经验测度(DTEM)的距离。在本文中,我们对DTEM的偏差进行了严格控制。我们的分析依赖于对经验过程的局部分析。特别地,我们证明了DTEM的收敛速度直接取决于特定分位数函数在零点的正则性,该分位数函数包含一些关于支撑几何的局部信息。这个分位数函数是精确描述几何推理问题难度的相关量。几个数值实验证明了DTEM的收敛性,也证实了我们的边界是紧的。

MSC公司:

62G05型 非参数估计
62G30型 订单统计;经验分布函数
68单位05 计算机图形;计算几何(数字和算法方面)
62-07 数据分析(统计)(MSC2010)
28A33型 测度空间,测度收敛

软件:

R(右)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Arias-Castro,E.、Donoho,D.和Huo,X.(2006)。均匀随机点背景下丝状结构的自适应多尺度检测。,《统计年鉴》,34:326-349·Zbl 1091.62095号 ·doi:10.1214/009053605000000787
[2] Biau,G.、Chazal,F.、Cohen-Steiner,D.、Devroye,L.和Rodriguez,C.(2011年)。几何推断的加权k近邻密度估计。,《电子统计杂志》,5:204-237·Zbl 1274.62264号 ·doi:10.1214/11-EJS606
[3] Bobkov,S.和Ledoux,M.(2014)。一维经验测度、订单统计和Kantorovich运输距离。,
[4] Buchet,M.、Chazal,F.、Dey,T.K.、Fan,F.、Oudot,S.Y.和Wang,Y.(2015a)。具有离群值的标量场的拓扑分析。在,程序。交响乐。计算几何·Zbl 1378.68159号
[5] Buchet,M.、Chazal,F.、Oudot,S.和Sheehy,D.R.(2015b)。度量的有效且健壮的持久同源性。年,第26届ACM-SIAM离散算法研讨会论文集。暹罗。SIAM公司·Zbl 1357.65022号 ·doi:10.1016/j.comgeo.2016.07.001
[6] Caillerie,C.、Chazal,F.、Dedecker,J.和Michel,B.(2011年)。Wasserstein度量和几何推断的反褶积。,电子。《统计杂志》,5:1394-1423·Zbl 1274.62363号 ·doi:10.1214/11-EJS646
[7] Cambanis,S.、Simons,G.和Stout,W.(1976年)。当边距固定时,\(\mathbbEk(x,y)\)的不等式。,Zeitschrift für Wahrscheinlichkeits theorye und verwandte Gebiete,36(4):285-294·Zbl 0325.60002号 ·doi:10.1007/BF00532695
[8] Carlsson,G.(2009)。拓扑和数据。,美国数学学会公报,46(2):255-308·Zbl 1172.62002号 ·doi:10.1090/S0273-0979-09-01249-X
[9] Chazal,F.、Chen,D.、Guibas,L.、Jiang,X.和Sommer,C.(2011年a)。数据驱动的轨迹平滑。在,程序。ACM-SIGSPATIAL GIS。
[10] Chazal,F.、Cohen-Steiner,D.和Lieutier,A.(2009a)。法锥近似和偏移形状同位素。,计算几何,42(6):566-581·Zbl 1169.65015号 ·doi:10.1016/j.comgeo.2008.12.002
[11] Chazal,F.、Cohen-Steiner,D.、Lieutier,A.和Thibert,B.(2009b)。曲率测度的稳定性。,计算机图形论坛(2009年编纂),第1485-1496页。
[12] Chazal,F.、Cohen Steiner,D.和Mérigot,Q.(2011b)。概率测度的几何推断。,计算数学基础,11(6):733-751·Zbl 1230.62074号 ·doi:10.1007/s10208-011-9098-0
[13] Chazal,F.、Fasy,B.T.、Lecci,F.,Michel,B.、Rinaldo,A.和Wasserman,L.(2014a)。稳健拓扑推理:到测度的距离和核距离。,arXiv公司·Zbl 1395.62187号
[14] Chazal,F.、Fasy,B.T.、Lecci,F.,Michel,B.、Rinaldo,A.和Wasserman,L.(2014b)。持久同源性的子采样方法。,arXiv预印本1406.1901,ICML15接受。
[15] Chazal,F.、Glisse,M.、Labruère,C.和Michel,B.(2015)。拓扑数据分析中持久图估计的收敛速度。,机器学习研究杂志,16:3603-3635·Zbl 1351.62009年
[16] Chazal,F.、Guibas,L.J.、Oudot,S.Y.和Skraba,P.(2013)。黎曼流形中基于持久性的聚类。,美国医学杂志(JACM),60(6):41·Zbl 1281.68176号 ·doi:10.1145/2535927
[17] Chazal,F.和Lieutier,A.(2008年)。基于噪声和非均匀逼近的光滑流形重构。,计算几何,40(2):156-170·Zbl 1153.65316号 ·doi:10.1016/j.comgeo.2007.07.001
[18] Cuevas,A.(2009)。集合估计:统计学和几何学之间的另一座桥梁。,博尔。埃斯塔德。投资。操作,25(2):71-85.
[19] Cuevas,A.和Rodríguez-Casal,A.(2004)。关于边界估计。,应用概率的进展,第340-354页·Zbl 1045.62019号 ·doi:10.1239/aap/1086957575
[20] del Barrio,E.、Giné,E.和Matrán,C.(1999)。经验分布和真实分布之间Wasserstein距离的中心极限定理。,安·普罗巴布,27:1009-1971·Zbl 0958.60012号 ·doi:10.1214/aop/1022677394
[21] del Barrio,E.、Giné,E.和Utzet,F.(2005)。经验分位数过程(mathbbL_2)泛函的渐近性,及其在基于加权Wasserstein距离的拟合检验中的应用。,伯努利,11:131-189·Zbl 1063.62072号 ·doi:10.3150/bj/1110228245
[22] Dereich,S.、Scheutzow,M.和Schottstedt,R.(2013)。构造性量化:通过经验测量的近似。,Ann.Inst.H.PoincaréProbab公司。统计人员,49:1183-1203. ·Zbl 1283.60063号 ·doi:10.1214/12-AIHP489
[23] Devroye,L.和Wise,G.L.(1980)。通过支持度的非参数估计检测异常行为。,SIAM应用数学杂志,38(3):480-488·Zbl 0479.62028号 ·数字对象标识代码:10.1137/0138038
[24] Dvoretzky,A.、Kiefer,J.和Wolfowitz,J.(1956年)。样本分布函数和经典多项式估计的渐近极小极大特征。,《数理统计年鉴》,第642-669页·Zbl 0073.14603号 ·doi:10.1214/aoms/1177728174
[25] Fasy,B.T.、Lecci,F.、Rinaldo,A.、Wasserman,L.、Balakrishnan,S.、Singh,A.等人(2014)。持久性图的置信集。,《统计年鉴》,42(6):2301-2339·Zbl 1310.62059号 ·doi:10.1214/14-AOS1252
[26] Fournier,N.和Guillin,A.(2013年)。关于经验测度的wasserstein距离的收敛速度。,概率论和相关领域,第1-32页·Zbl 1325.60042号 ·doi:10.1007/s00440-014-0583-7
[27] Genovese,C.、Perone-Pacifico,M.、Verdinelli,I.和Wasserman,L.(2009年)。关于梯度场的路径密度。,《统计年鉴》,37:3236-3271·Zbl 1191.62062号 ·doi:10.1214/08-AOS671
[28] Genovese,C.R.、Perone-Pacifico,M.、Verdinelli,I.和Wasserman,L.(2012年)。hausdorff损失下的流形估计和奇异反褶积。,《统计年鉴》,40(2):941-963·Zbl 1274.62237号 ·doi:10.1214/12-AOS994
[29] Guibas,L.、Morozov,D.和Mérigot,Q.(2013)。见证了k距离。,离散计算。地理,49:22-45. ·Zbl 1272.68414号 ·doi:10.1007/s00454-012-9465-x
[30] Hastie,T.和Stuetzle,W.(1989年)。主曲线。,J.Amer。统计师。协会,84(406):502-516·Zbl 0679.62048号 ·doi:10.2307/2289936
[31] Mammen,E.、Tsybakov,A.B.等人(1999年)。平滑判别分析。,《统计年鉴》,27(6):1808-1829·Zbl 0961.62058号 ·doi:10.1214/aos/1017939240
[32] 马萨特,P.(1990)。dvoretzky-kiefer-wolfowitz不等式中的紧常数。,《概率年鉴》,18(3):第1269-1283页·Zbl 0713.62021号 ·doi:10.1214/aop/1176990746
[33] 马萨特,P.(2007)。,集中度不等式和模型选择。柏林施普林格。2003年7月6日至23日在圣弗洛尔举行的第33届概率论暑期学校讲座·Zbl 1170.60006号 ·doi:10.1007/978-3-540-48503-2
[34] Niyogi,P.、Smale,S.和Weinberger,S.(2008年)。从随机样本中寻找高置信度子流形的同调。,离散与计算几何,39(1-3):419-441·兹比尔1148.68048 ·doi:10.1007/s00454-008-9053-2
[35] Phillips,J.M.、Wang,B.和Zheng,Y.(2014)。核密度估计的几何推断。,arXiv预印本1307.7760·Zbl 1422.68257号
[36] R核心团队(2014)。,R: 统计计算语言和环境。R统计计算基金会,奥地利维也纳。
[37] Rachev,S.和Rüschendorf,L.(1998年)。,《大众运输问题》,《概率论及其应用》第二卷。斯普林格·弗拉格·Zbl 0990.60500号
[38] Shorack,G.R.和Wellner,J.A.(2009)。,统计应用的经验过程,第59卷。SIAM公司·Zbl 1171.62057号 ·数字对象标识代码:10.1137/1.9780898719017
[39] Singh,A.、Scott,C.和Nowak,R.(2009年)。密度水平集的自适应hausdorff估计。,《统计年鉴》,37(5B):2760-2782·Zbl 1173.62019年 ·doi:10.1214/08-AOS661
[40] Villani,C.(2008)。,最佳交通:新旧。Grundlehren Der Mathematischen Wissenschaften大学。斯普林格·弗拉格·Zbl 1156.53003号 ·doi:10.1007/978-3-540-71050-9
[41] Yu,B.(1997)。阿苏德、法诺和勒康。年,Lucien Le Cam的Festschrift,第423-435页。纽约州施普林格·Zbl 0896.62032号 ·doi:10.1007/978-1-4612-1880-7_29
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。