×

LDLE:低失真局部特征映射。 (英语) Zbl 07626797号

小结:我们提出了低失真局部特征映射(LDLE),这是一种流形学习技术,它构造了低维数据集的一组低失真局部视图,并注册它们以获得全局嵌入。局部视图是使用图Laplacian的全局特征向量构造的,并使用Procrustes分析进行注册。这些特征向量的选择可能因地区而异。与现有技术相比,LDLE可以通过将封闭的和不可定向的流形分解,将它们嵌入到其内在维度中。它还提供了关于撕裂嵌入边界的粘合指令,以帮助识别原始流形的拓扑。我们的实验结果表明,LDLE在很大程度上保持了恒定范围内的距离,而其他技术产生了更高的失真。我们还证明,即使数据有噪声或稀疏,LDLE也能生成高质量的嵌入。

MSC公司:

68T05型 人工智能中的学习和自适应系统

软件:

UMAP公司
PDF格式BibTeX公司 XML格式引用
全文: arXiv公司 链接

参考文献:

[1] A.Aswani,P.Bickel,C.Tomlin等。流形上的回归:外导数的估计。《统计年鉴》,39(1):48-812011·Zbl 1209.62063号
[2] B.Bechtold、P.Fletcher、seamusholden和S.Gorur-Shandlya.bastibe/ViolinplotMatlab:一个良好的起点,2021年。统一资源定位地址https://doi.org/10.5281/zenodo.4559847。
[3] M.Belkin和P.Niyogi。用于降维和数据表示的拉普拉斯特征映射。神经计算,15(6):1373-13962003·Zbl 1085.68119号
[4] M.Belkin和P.Niyogi。拉普拉斯流形方法的理论基础。《计算机与系统科学杂志》,74(8):1289-13082008·Zbl 1157.68056号
[5] T.Berry和T.Sauer。带边界流形上的密度估计。计算统计与数据分析,107:1-172017·Zbl 1466.62029号
[6] Y.Blau和T.Michaeli。非冗余谱降维。2017年欧洲机器学习和数据库知识发现联合会议,第256-271页。
[7] Y.Canzani。通过laplacian.2013.URL分析流形http://kkk.math。哈佛edu/canzani/docs/Laplacian.pdf。
[8] Y.C.Chen和M.Meila。选择宽高比较大的流形的独立坐标。神经信息处理系统进展,2019年,32:1088-1097。
[9] 郑美英和吴海涛。流形上的局部线性回归及其几何解释。《美国统计协会杂志》,108(504):1421-14342013·Zbl 1426.62402号
[10] X.Cheng和G.Mishne。谱嵌入范数:深入研究拉普拉斯图的谱。SIAM成像科学杂志,13(2):1015-10482020·兹比尔1456.62118
[11] X.Cheng和H.T.Wu。图Laplacian与knn自校正核的收敛性。arXiv预印本arXiv:2011.014792020·Zbl 1501.05014号
[12] X.Cheng和N.Wu。基于流形热插值的高斯核化图Laplacian的特征收敛性。arXiv预印本arXiv:2101.098752021·Zbl 1496.65203号
[13] X.Cheng、G.Mishne和S.Steinerberger。节点集的几何结构和异常值检测。《数论杂志》,185:48-642018年·Zbl 1391.35128号
[14] A.Cloninger和W.Czaja。数据相关图的特征向量定位。国际抽样理论与应用会议(SampTA),第608-612页,2015年。
[15] A.Cloninger和S.Steinerberger。关于拉普拉斯特征函数的对偶几何。实验数学,0(0):1-112018·Zbl 1472.35101号
[16] R.R.Coifman和S.Lafon。扩散贴图。应用和计算谐波分析,21(1):5-30,2006·兹比尔1095.68094
[17] F.Crosilla和A.Beinat。通过独立模型对摄影测量区块平差使用广义普鲁斯特分析。ISPRS摄影测量和遥感杂志,56:195-2092002年4月。
[18] C.J.Dsilva、R.Talmon、R.R.Coifman和I.G.Kevrekidis。通过流形学习对非线性动力系统的简约表示:趋化性案例研究。应用和计算谐波分析,44(3):759-7732018·Zbl 1390.68523号
[19] J.C.Gower。广义procutes分析。《心理测量学》,40(1):33-511975·Zbl 0305.62038号
[20] J.C.Gower、G.B.Dijksterhuis等人,《Procrustes问题》,第30卷。牛津大学出版社,2004年·Zbl 1057.62044号
[21] M.Hein,J.-Y.Audibert和U.v.Luxburg。图拉普拉斯算子及其在随机邻域图上的收敛性。机器学习研究杂志,8(6),2007年·Zbl 1222.68215号
[22] J.L.Hintze和R.D.Nelson。小提琴图:一种盒形图密度痕迹协同作用。美国统计学家,52(2):181-1841998。
[23] I.T.Jolliffe和J.Cadima。主成分分析:综述和最新发展。《皇家学会哲学学报A:数学、物理和工程科学》,374(2065):201502022016·Zbl 1353.62067号
[24] P.W.Jones、M.Maggioni和R.Schul。通过拉普拉斯算子的热核和本征函数进行的通用局部参数化。arXiv预印本arXiv:0709.199752007·兹比尔1194.58031
[25] D.Kobak和G.C.Linderman。初始化对于保存t-SNE和UMAP中的全局数据结构至关重要。《自然生物技术》,39(2):156-1572021。
[26] S.Lafon公司。扩散贴图和几何谐波。博士论文,第45页,2004年。
[27] R.R.Lederman和R.Talmon。使用交替扩散学习公共潜在变量的几何结构。应用和计算谐波分析,44(3):509-5362018·Zbl 1394.94297号
[28] D.Li和D.B.Dunson。用球体估算测地距离。arXiv预印本arXiv:1907.002962019。
[29] L.诉d.Maaten和G.Hinton。使用t-SNE可视化数据。机器学习研究杂志,9(11):2579-26052008·Zbl 1225.68219号
[30] MATLAB软件。Procrustes例程。Procrustes分析、统计和机器学习工具箱,2018年。
[31] L.McInnes、J.Healy和J.Melville。Umap:统一流形近似和降维投影。arXiv预印本arXiv:1802.034262018。
[32] G.Mishne和I.Cohen。使用扩散图进行多尺度异常检测。IEEE信号处理专题期刊,7(1):111-1232013。
[33] G.Mishne、R.R.Coifman、M.Lavzin和J.Schiller。生物图像中的细胞结构自动提取及其在钙成像数据中的应用。bioRxiv,2018年。
[34] G.Mishne、U.Shaham、A.Cloninger和I.Cohen。扩散网。应用和计算谐波分析,47(2):259-2852019·兹比尔1430.68278
[35] E.Peterfreund、O.Lindenbaum、F.Dietrich、T.Bertalan、M.Gavish、I.G.Kevrekidis和R.R.Coifman。LOCA:标准化数据坐标的本地保角自动编码器。arXiv预印arXiv:2004.072342020。
[36] S.T.Roweis和L.K.Saul。局部线性嵌入的非线性降维。《科学》,290(5500):2323-23262000。
[37] 斋藤N。我们如何自然地排序和组织图的拉普拉斯特征向量?IEEE统计信号处理研讨会(SSP),第483-487页,2018年。
[38] P.H.Sch¨onemann先生。正交procutes问题的广义解。《心理测量学》,31(1):1-101966年·Zbl 0147.19401号
[39] A.Singer和H.t.Wu。定向性和扩散贴图。应用和计算谐波分析,31(1):44-582011·Zbl 1218.68131号
[40] S.Steinerberger公司。通过热流的本征函数节点集的下限。偏微分方程通信,39(12):2240-22612014·Zbl 1304.35455号
[41] S.Steinerberger公司。关于拉普拉斯本征函数乘积的光谱分辨率。arXiv预印本arXiv:1711.098262017·Zbl 1436.35265号
[42] J.M.Ten Berge。两个或多个矩阵的正交程序旋转。《心理测量学》,42(2):267-2761977年·Zbl 0362.92020号
[43] J.B.Tenenbaum、V.De Silva和J.C.Langford。非线性降维的全局几何框架。科学,290(5500):2319-23232000。
[44] N.G.Trillos、M.Gerlach、M.Hein和D.Slepécev。随机几何图上的图Laplacian向Laplace-Beltrami算子谱收敛的误差估计。计算数学基础,20(4):827-8872020·Zbl 1447.62141号
[45] N.G.Trillos、P.He和C.Li。基于图形的多流形聚类的大样本光谱分析。arXiv预印本arXiv:2107.136102021。
[46] L.C.Vankadara和U.v.Luxburg.机器学习失真的测量。神经信息处理系统进展,2018年31月。
[47] L.Zelnik-Manor和P.Perona。自校正谱聚类。神经信息处理系统进展,第1601-1608页,2005年。
[48] S.Zhang、A.Moscovich和A.Singer。产品流形学习。国际人工智能与统计会议,第130卷,第3241-3249页。PMLR,2021年。
[49] Z.Zhang和H.Zha。基于局部切线空间对齐的非线性降维。智能数据工程和自动学习国际会议,第477-4812003页。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。