×

应用于持久同源性的\(k\)-距离的维数缩减。 (英语) Zbl 1482.55005号

虽然已知持久同源性对于潜在距离函数的小规模扰动具有稳定性,但已知其易受大规模“离群值”的存在影响。在实践中,通常通过使距离函数更健壮来解决此问题,从而实现诸如到度量单位的距离函数或\(k\)-距离(对于离散集)。考虑到在高维中计算这些距离的高度复杂性,有必要研究在多大程度上它们在降维算法中得以保留。结果由D.R.希伊【in:2014年6月8日至11日,日本京都,第30届计算几何年度研讨会论文集,SoCG’14。纽约州纽约市:计算机协会(ACM)。328–334 (2014;Zbl 1397.68207号)]表明,给定[0,1]\中的任意(ε),在随机投影下,持久同源性可以近似地保持,直到乘法因子为((1\pm\epsilon))。这为分析基于低维嵌入的高维点云的持久同源性打开了大门。Sheehy在上述论文中提出的一个长期存在的问题是,在随机投影下,(k)距离本身是否也会以类似的方式保持不变。本文肯定地回答了这个问题,表明基于k距离的Tech滤波在任何线性映射下都是保持不变的。除了证明这一结果外,本文还提出了它的其他扩展和含义,例如在高维欧氏空间的低维子流形的情况下,改进了距离保持的边界。

MSC公司:

55N31号 持久同源性及其应用,拓扑数据分析
68单位05 计算机图形;计算几何(数字和算法方面)
62转40分 拓扑数据分析

软件:

CHomP公司
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Achlioptas,D.:数据库友好型随机投影。In Buneman,P.(ed.)第二十届ACM SIGACT-SIGMOD-SIGART数据库系统原理研讨会论文集,2001年5月21日至23日,美国加利福尼亚州圣巴巴拉。ACM,2001年。doi:10.1145/375551.375608·Zbl 1054.68040号
[2] Ailon,N。;Chazelle,B.,《快速Johnson-Lindenstraus变换和近似最近邻》,SIAM J.Compute。,39, 1, 302-322 (2009) ·Zbl 1185.68327号 ·数字对象标识代码:10.1137/060673096
[3] Alon,N.,Klartag,B.:近似内积的最佳压缩和尺寸缩减。在Umans,C.(ed.)第58届IEEE计算机科学基础年度研讨会上,FOCS 2017,美国加州伯克利,2017年10月15-17日,第639-650页。IEEE计算机学会,(2017)。doi:10.1109/FOCS.2017.65,
[4] Aurenhamer,F.,关于Voronoi图的一个新的对偶结果,离散。计算。地理。,5, 243-254 (1990) ·Zbl 0693.68023号 ·doi:10.1007/BF02187788
[5] 巴拉纽克,RG;Wakin,MB,光滑流形的随机投影,发现。计算。数学。,9, 1, 51-77 (2009) ·Zbl 1172.53005号 ·doi:10.1007/s10208-007-9011-z
[6] Boucheron,S.,Lugosi,G.,Massart,P.:集中不等式-独立的非渐近理论。牛津大学出版社,牛津(2013)。doi:10.1093/acprof:oso/9780199535255.001.0001·Zbl 1279.60005号
[7] Buchet,M。;查扎尔,F。;Oudot,SY;Sheehy,DR,度量的高效和稳健持久同源性,计算。地理。,58, 70-96 (2016) ·Zbl 1357.65022号 ·doi:10.1016/j.comgeo.2016.07.001
[8] Buchet,M。;戴伊,蒂克;Wang,J。;Wang,Y.,Declutter和重采样:走向无参数去噪,JoCG,9,2,21-46(2018)·Zbl 1417.68261号 ·doi:10.20382/jocg.v9i2a3
[9] 查扎尔,F。;科恩·斯坦纳,D。;Mérigot,Q.,概率测度的几何推理,Found。计算。数学。,11, 6, 733-751 (2011) ·Zbl 1230.62074号 ·doi:10.1007/s10208-011-9098-0
[10] Chazal,F.,de Silva,V.,Glisse,M.,Oudot,S.Y.:持久性模块的结构和稳定性。施普林格数学简介。施普林格,柏林(2016)。doi:10.1007/978-3-319-42545-0·Zbl 1362.55002号
[11] Chazal,F.,Oudot,S.:欧几里德空间中基于持久性的重建。在Teillaud,M.(编辑),《第24届ACM计算几何研讨会论文集》,马里兰州大学公园,美国,2008年6月9日至11日,第232-241页。ACM(2008)。doi:10.1145/1377676.1377719·Zbl 1271.57058号
[12] 克拉克森,K.L.:流形随机投影的更严格边界。在Teillaud,M.(编辑),《第24届ACM计算几何研讨会论文集》,马里兰州大学公园,美国,2008年6月9日至11日,第39-48页。ACM(2008)。doi:10.145/1377676.1377685·Zbl 1221.68261号
[13] 克拉克森,吉隆坡;肖尔,普华永道,随机抽样在计算几何中的应用。二、 谨慎。计算。地理。,4, 387-421 (1989) ·Zbl 0681.68060号 ·doi:10.1007/BF02187740
[14] 达斯古普塔,S。;古普塔,A.,约翰逊和林登斯特劳斯定理的初等证明,随机结构。算法,22,1,60-65(2003)·兹比尔1018.51010 ·doi:10.1002/rsa.10073
[15] Dirksen,S.,《亚高斯矩阵降维:统一理论》,Found。计算。数学。,16, 5, 1367-1396 (2016) ·Zbl 1360.60031号 ·doi:10.1007/s10208-015-9280-x
[16] Edelsbrunner,H.,Harer,J.:计算拓扑——简介。美国数学学会(2010)。http://www.ams.org/bookstore-gettem/item=MBK-69 ·Zbl 1193.55001号
[17] Edelsbrunner,H。;Letscher,D。;Zomordian,A.,拓扑持久性和简化,Discret。计算。地理。,28, 4, 511-533 (2002) ·Zbl 1011.68152号 ·doi:10.1007/s00454-002-2885-2
[18] 埃尔金,M。;菲尔瑟,A。;Neiman,O.,端子嵌入件,Theor。计算。科学。,697, 1-36 (2017) ·Zbl 1378.68128号 ·doi:10.1016/j.tcs.2017.06.021
[19] Fefferman,C。;Mitter,S。;Narayanan,H.,《检验多种假设》,《美国数学杂志》。Soc.,29,4,983-1049(2016)·Zbl 1359.62122号 ·doi:10.1090/jams/852
[20] 福卡特,S。;Rauhut,H.,《压缩传感的数学导论》,应用。数字。谐波分析。(2013) ·Zbl 1315.94002号 ·doi:10.1007/978-0-8176-4948-7
[21] Giraud,C.:高维统计导论。Chapman和Hall/CRC关于统计学和应用概率的专著。泰勒和弗朗西斯(2014)。https://www.crcpress.com/Introduction-to-High-Dimensional-Statistics/Giraud/p/book/9781482237948
[22] Gordon,Y.:关于Milman不等式和通过网格逃逸的随机子空间。林登斯特劳斯,J.,米尔曼,V.D.(编辑),《功能分析的几何方面》,第84-106页,柏林,海德堡(1988)。doi:10.1007/BFb0081737
[23] 吉巴斯,LJ;莫罗佐夫,D。;Mérigot,Q.,见证k-distance,Discret。计算。地理。,49, 1, 22-45 (2013) ·Zbl 1272.68414号 ·doi:10.1007/s00454-012-9465-x
[24] Indyk P.、Motwani,R.、Raghavan,P.、Vempala,S.S.:多维空间中的局部保持散列。在Leighton,F.T.,Shor,P.W.(编辑)第二十九届美国计算机学会计算理论年度研讨会论文集,美国得克萨斯州埃尔帕索,1997年5月4日至6日,第618-625页。ACM(1997)。doi:10.1145/258533.258656·Zbl 0963.68045号
[25] 约翰逊,WB;Lindenstrauss,J.,Lipschitz映射到Hilbert空间的扩展,Contemp。数学。,26, 189-206, 1 (1984) ·Zbl 0539.46017号 ·doi:10.1007/BF02764938
[26] 凯恩,DM;Nelson,J.,Sparser Johnson-Lindenstraus transforms,J.ACM,61,1,4:1-4:23(2014)·Zbl 1295.68134号 ·数字对象标识代码:10.1145/2559902
[27] 克拉默,F。;Ward,R.,《通过受限等距特性的新的和改进的Johnson-Lindenstraus嵌入》,SIAM J.Math。分析。,43, 3, 1269-1281 (2011) ·Zbl 1247.15019号 ·数字对象标识代码:10.1137/100810447
[28] Lotz,M.,低复杂度模型的持久同源性,Proc。R.Soc.A数学。物理学。工程科学。,475, 2230, 20190081 (2019) ·兹比尔1472.62180 ·doi:10.1098/rspa.2019.0081
[29] Mahabadi,S.、Makarychev,K.、Makaychev,Y.、Razenshteyn,I.P.:In Ilias,D.、David,K.和Monika,H.(eds.)《通过外部bi-lipschitz扩展实现非线性降维》,第50届ACM SIGACT计算理论年会论文集,STOC 2018,美国加利福尼亚州洛杉矶,2018年6月25-29日,第1088-1101页。ACM(2018)。数字标识代码:10.1145/3188745.3188828·Zbl 1428.68326号
[30] Matoušek,J.,关于Johnson-Lindenstrauss引理的变体,随机结构。算法,33,2,142-156(2008)·Zbl 1154.51002号 ·doi:10.1002/rsa.20218
[31] Narayanan,S.,Nelson,J.:欧几里德空间中的最优终端降维。Charikar,M.,Cohen,E.(eds.)《第51届ACM SIGACT计算理论年度研讨会论文集》,STOC 2019,美国亚利桑那州凤凰城,2019年6月23日至26日,第1064-1069页。ACM,(2019年)。数字对象标识代码:10.1145/3313276.3316307·Zbl 1433.68371号
[32] Oudot,S.Y.:持久性理论——从Quiver表示到数据分析。数学调查与专题论文第209卷。美国数学学会(2015)。http://bookstore.ams.org/surv-209/ ·Zbl 1335.55001号
[33] Phillips,J.M.,Wang,B.,Zheng,Y.:核密度估计的几何推断。在Arge,L.,Pach,J.(编辑)第31届国际计算几何研讨会上,2015年6月22日至25日,SoCG,荷兰埃因霍温,LIPIcs第34卷,第857-871页。Dagstuhl Schloss-Leibniz-Zentrum für Informatik,(2015)。doi:10.4230/LIPIcs。SOCG.2015.857号机组·Zbl 1422.68257号
[34] Sarlós,T.:In:通过随机投影改进大矩阵的近似算法,第47届IEEE计算机科学基础年度研讨会(FOCS 2006),2006年10月21日至24日,美国加利福尼亚州伯克利,论文集,第143-152页。IEEE计算机学会(2006)。doi:10.1109/FOCS.2006.37
[35] Sheehy,D.R.:随机投影下距离函数的持久同源性。Cheng,S.-W.,Devillers,O.(eds.)第30届计算几何年度研讨会,SOCG’14,日本京都,2014年6月8日至11日,第328页。ACM(2014)。doi:10.1145/2582112.2582126·Zbl 1397.68207号
[36] Verma,N.:关于保持流形上路径的随机投影的注释。技术报告,加州大学圣地亚哥分校(2011年)。https://csetechrep.ucsd.edu/Dienst/UI/2.0/Describe/ncstrl.ucsd_cse/CS2011-0971
[37] Vershynin,R.:《高维概率:数据科学应用导论》。剑桥统计与概率数学系列。剑桥大学出版社(2018)。文件编号:10.1017/9781108231596·兹比尔1430.60005
[38] Zhang,J.,《离群值检测的进展:一项调查》,EAI认可的Trans。可扩展信息系统。,1、1、e2(2013)·doi:10.4108/trans.sis.2013.01-03e2
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。