×

数据的形状和概率度量。 (英语) Zbl 1464.62321号

摘要:我们引入了与欧几里德随机变量相关的多尺度协方差张量场(CTF)的概念,作为了解其分布形状的入口。多尺度CTF量化了所有空间尺度下数据景观中每个点的数据变化,而通常的协方差张量只量化了平均值的全球变化。局部协方差的经验形式以前曾用于数据分析和可视化,例如在局部主成分分析中,但我们开发了一个框架,用于系统处理理论问题和计算模型的数学分析。我们证明了关于概率测度之间Wasserstein距离的强稳定性定理,得到了估计量的一致性结果,以及经验CTF收敛速度的界。这些结果表明,CTF对采样、噪声和异常值具有鲁棒性。我们提供了大量的例子来说明CTF如何让我们从数据中提取形状,并将CTF应用于流形聚类,即根据数据点在欧几里得空间的一组可能相交的光滑子流形中的噪声隶属度对数据点进行分类的问题。我们证明了所提出的流形聚类方法是稳定的,并进行了一些实验来说明该方法。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
62兰特 歧管统计

软件:

SIFT公司
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Little,A。;Jung,Y.-M。;Maggioni,M.,用多尺度奇异值分解估计高维噪声低维流形样本的固有维数,(IEEE/SP第15届统计信号处理研讨会(2009)),85-88
[2] 迪亚斯·马丁内斯,D。;梅莫利,F。;Mio,W.,《多尺度协方差场、局部尺度和形状变换》,(Nielsen,F.;Barbaresco,F.,《信息几何科学》,《信息几何学》,计算机科学讲稿,第8085卷(2013),Springer),794-801·Zbl 1322.62185号
[3] Villani,C.,《最佳交通主题》,数学研究生课程,第58卷(2003),美国数学学会:美国数学学会普罗维登斯,RI·兹比尔1106.90001
[4] 维拉尼,C.,《新旧最佳交通》(2009),斯普林格出版社·Zbl 1156.53003号
[5] 福尼尔,N。;Guillin,A.,关于经验度量的Wasserstein距离的收敛速度,Probab。理论相关领域,162707-738(2015)·Zbl 1325.60042号
[6] 北卡罗来纳州加西亚·特里洛斯。;Slepčev,D.,关于∞运输距离中经验测度的收敛速度,加拿大。数学杂志。,67, 1358-1383 (2015) ·Zbl 1355.60009号
[7] Allard,W。;陈,G。;Maggioni,M.,数据集的多尺度几何方法II:几何多分辨率分析,应用。计算。哈蒙。分析。,32, 435-462 (2012) ·Zbl 1242.42038号
[8] J.伯克曼。;Caelli,T.,使用协方差技术计算表面几何和分割,IEEE Trans。模式分析。机器。智力。,16, 1114-1116 (1994)
[9] Rusu,R.,《人类生活环境中日常操作的语义3D对象地图》(2009),慕尼黑理工大学,博士论文
[10] 梅迪奥尼,G。;李,M.S。;Tang,C.-H.,《分割和分组的计算框架》(2000),爱思唯尔科学·Zbl 0952.68154号
[11] 布罗克斯,T。;罗森哈恩,B。;Cremers,D。;Seidel,H.-P.,人类运动跟踪用自适应各向异性内核的非参数密度估计,(人类运动-理解、建模、捕获和动画。人类运动-了解、建模、捕捉和动画,计算机科学讲义,第4814卷(2007),Springer),152-165
[12] 库什尼尔,D。;M.加伦。;Brandt,A.,快速多尺度聚类和流形识别,模式识别。,39, 10, 1876-1891 (2006) ·兹比尔1096.68720
[13] Goldberg,A.B。;朱,X。;辛格,A。;徐,Z。;Nowak,R.D.,《多模式半监督学习》(AISTATS(2009)),169-176
[14] 龚,D。;X.赵。;Medioni,G.,鲁棒多流形结构学习,arXiv预印本
[15] Wang,Y。;姜瑜。;Wu,Y。;周振华,多流形上的谱聚类,IEEE Trans。神经网络。,22, 7, 1149-1161 (2011)
[16] Arias-Castro,E.,当数据为混合维时,基于成对距离的聚类,IEEE Trans。通知。理论,57,3,1692-1706(2011)·Zbl 1366.62117号
[17] 阿里亚斯·卡斯特罗,E。;陈,G。;Lerman,G.,基于局部线性近似的光谱聚类,电子。J.Stat.,51537-1587(2011)·Zbl 1271.62132号
[18] 阿里亚斯·卡斯特罗,E。;Lerman,G。;Zhang,T.,基于局部主成分分析的光谱聚类,arXiv预印本·Zbl 1437.62225号
[19] 维达尔,R。;马云(Ma,Y.)。;Sastry,S.,广义主成分分析(GPCA),IEEE Trans。模式分析。机器。智力。,27, 12, 1945-1959 (2005)
[20] Govind,V.,用于几何分组和分割的张量分解,(IEEE计算机视觉和模式识别会议,第1卷(2005)),1150-1157
[21] 陈,G。;Lerman,G.,谱曲率聚类(SCC),国际计算杂志。视觉。,81, 3, 317-330 (2009)
[22] Lerman,G。;Zhang,T.,基于几何极小化的多个子空间稳健恢复,Ann.Statist。,39, 5, 2686-2715 (2011) ·Zbl 1232.62097号
[23] 张,T。;Szlam,A。;Wang,Y。;Lerman,G.,《通过局部最佳拟合平面进行混合线性建模》,《国际计算杂志》。视觉。,100, 3, 217-240 (2012) ·Zbl 1259.68207号
[24] 刘,G。;林,Z。;Yan,S。;Sun,J。;Ma,Y.,通过低秩表示实现子空间结构的稳健恢复,IEEE Trans。模式分析。机器。智力。,35, 1, 171-184 (2013)
[25] Elhamifar,E。;Vidal,R.,《稀疏子空间聚类:算法、理论和应用》,IEEE Trans。模式分析。机器。智力。,352765-2781(2013年)
[26] Soltanolkotabi,M。;Elhamifar,E。;Candes,E.J.,稳健子空间聚类,Ann.Statist。,42, 2, 669-699 (2014) ·Zbl 1360.62353号
[27] 政治学硕士。;Perona,P.,通过局部线性嵌入进行分组和降维,(NIPS(2001)),1255-1262
[28] Gionis,A。;Hinneburg,A。;Papadimitriou,S。;Tsaparas,P.,维度诱导聚类,(第十一届ACM SIGKDD数据挖掘知识发现国际会议论文集(2005),ACM),51-60
[29] 纪念品,R。;Pless,R.,流形聚类,(国际计算机视觉会议(2005)),648-653
[30] Haro,G。;Randall,G。;Sapiro,G.,《分层学习:检测高维点云中的混合密度和维数》(NIPS(2006)),553-560
[31] 王,X。;斯拉瓦基斯,K。;Lerman,G.,黎曼多流形建模,arXiv预印本
[32] 卡尔森,G。;Mémoli,F.,层次聚类方法的特征、稳定性和收敛性,J.Mach。学习。Res.,11425-1470(2010)·Zbl 1242.62050
[33] 布鲁斯,J。;Giblin,P.,《曲线与奇点:奇点理论的几何导论》(1992),剑桥大学出版社·Zbl 0534.58008号
[34] Givens,C。;Short,R.,概率分布的一类Wasserstein度量,密歇根数学。J.,31,2,231-240(1984)·Zbl 0582.60002号
[35] Dudley,R.M.,《真实分析与概率》,《剑桥高等数学研究》,第74卷(2002年),剑桥大学出版社:剑桥大学出版社,英国剑桥·Zbl 1023.60001号
[36] Jain,A。;Dubes,R.,《聚类数据的算法》(1988),普伦蒂斯·霍尔:普伦蒂斯霍尔-恩格尔伍德克利夫斯,新泽西州·Zbl 0665.62061号
[37] 特隆·R。;Vidal,R.,三维运动分割算法比较基准,(IEEE计算机视觉和模式识别会议(2007)),1-8
[38] 陈,G。;Lerman,G.,《混合线性建模的多向谱聚类框架基础》,Founds。计算。数学。,9, 5, 517-558 (2009) ·Zbl 1176.68155号
[39] Sibson,R.,SLINK:单链簇方法的最有效算法,计算。J.,16,1,30-34(1973)
[40] Burago,D。;Y.Burago。;Ivanov,S.,米制几何课程,数学研究生课程(2001),美国数学学会:美国数学学会普罗维登斯,RI·Zbl 0981.51016号
[41] Mémoli,F.,Gromov-Wasserstein距离和对象匹配的度量方法,Found。计算。数学。,1-71 (2011) ·Zbl 1244.68078号
[42] 科伊夫曼,R。;Lafon,S.,扩散图,应用。计算。哈蒙。分析。,21, 1, 5-30 (2006) ·Zbl 1095.68094号
[43] Lowe,D.G.,《不同尺度关键点的独特图像特征》,《国际计算机杂志》。视觉。,60, 2, 91-110 (2004)
[44] 琼斯,P.W。;Le,T.M.,局部尺度和多尺度图像分解,应用。计算。哈蒙。分析。,26, 3, 371-394 (2009) ·Zbl 1172.68648号
[45] Le,T。;Mémoli,F.,《曲线和曲面的局部比例》,应用。计算。哈蒙。分析。,33401-437(2012年)·Zbl 1252.68332号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。