×

全局思考,在流形设置下局部拟合:局部线性嵌入的渐近分析。 (英语) Zbl 1405.62058号

摘要:自2000年引入以来,局部线性嵌入(LLE)在数据科学中得到了广泛的应用。我们提供了流形设置下LLE的渐近分析。我们证明,对于一般流形,渐近地我们可能无法获得拉普拉斯-贝尔特拉米算子,并且除非选择正确的正则化,否则结果可能取决于非均匀采样。我们还导出了相应的核函数,这表明LLE不是马尔可夫过程。与其他常用的非线性算法,特别是扩散映射进行了比较,并讨论了它与局部线性回归的关系。

MSC公司:

62甲12 多元分析中的估计
第58页第99页 流形上的偏微分方程;微分算子
62G05型 非参数估计
62J05型 线性回归;混合模型
68T05型 人工智能中的学习和自适应系统

软件:

t-SNE公司
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Belkin,M.和Niyogi,P.(2003)。用于降维和数据表示的拉普拉斯特征映射。神经计算15 1373–1396·Zbl 1085.68119号 ·doi:10.1162/089976603321780317
[2] Belkin,M.和Niyogi,P.(2005年)。拉普拉斯流形方法的理论基础。学习理论。计算机科学课堂讲稿3559 486–500。柏林施普林格·Zbl 1137.68521号
[3] Belkin,M.和Niyogi,P.(2007年)。拉普拉斯特征映射的收敛性。神经信息处理系统进展19(NIPS 2006)129–136。麻省理工学院出版社,马萨诸塞州剑桥。
[4] Bérard,P.、Besson,G.和Gallot,S.(1994年)。通过热核嵌入黎曼流形。地理。功能。分析373–398·Zbl 0806.53044号 ·doi:10.1007/BF01896401
[5] Bérard,P.H.(1986)。谱几何:正问题和反问题。数学课堂笔记1207。柏林施普林格·Zbl 0608.58001号
[6] Cheeger,J.、Gromov,M.和Taylor,M.(1982年)。有限传播速度、拉普拉斯算子函数的核估计以及完备黎曼流形的几何。《差异几何杂志》17 15–53·Zbl 0493.53035号 ·doi:10.4310/jdg/124436699
[7] Cheng,M.-Y.和Wu,H.-T.(2013)。流形上的局部线性回归及其几何解释。J.Amer。统计师。协会108 1421–1434·Zbl 1426.62402号 ·doi:10.1080/016214519.2013.827984
[8] Coifman,R.R.和Lafon,S.(2006年)。扩散贴图。申请。计算。哈蒙。分析21 5-30·Zbl 1095.68094号 ·doi:10.1016/j.acha.2006.04.006
[9] Devroye,L.P.和Wagner,T.J.(1977年)。最近邻密度估计的强一致性。《统计年鉴》第5卷第536页至第540页·兹伯利0367.62061 ·doi:10.1214/aos/1176343851
[10] do Carmo,M.P.和Flaherty,F.(1992年)。黎曼几何。Birkhäuser,马萨诸塞州波士顿·Zbl 0752.53001号
[11] Donoho,D.L.、Gavish,M.和Johnstone,I.M.(2013)。尖峰协方差模型中特征值的最优收缩。可从arXiv:1311.0851获取·兹比尔1403.62099 ·doi:10.1214/17-AOS1601
[12] Donoho,D.L.和Grimes,C.(2003)。黑森特征映射:高维数据的局部线性嵌入技术。程序。国家。阿卡德。科学。美国100 5591–5596·Zbl 1130.62337号 ·doi:10.1073/pnas.1031596100
[13] El Karoui,N.(2010年)。关于信息加噪声核随机矩阵。统计年鉴38 3191–3216·兹比尔1200.62056 ·doi:10.1214/10-AOS801
[14] El Karoui,N.和Wu,H.-T.(2016)。图连接拉普拉斯方法可以对噪声具有鲁棒性。统计年鉴44 346–372·Zbl 1350.60036号 ·doi:10.1214/14-AOS1275
[15] Fan,J.和Gijbels,I.(1996年)。局部多项式建模及其应用。查普曼和霍尔/CRC,佛罗里达州博卡拉顿·Zbl 0873.62037号
[16] Gao,T.(2016)。纤维束的扩散几何形状。可从arXiv:1602.02330获取。
[17] Garcia Trillos,N.和Slepcev,D.(2018年)。光谱聚类一致性的一种变分方法。应用。计算。哈蒙。分析。出现·Zbl 1396.49013号 ·doi:10.1016/j.acha.2016.09.003
[18] Giné,E.和Koltchinskii,V.(2006年)。拉普拉斯–Beltrami算子的经验图拉普拉斯近似:大样本结果。在高维概率中。数理统计研究所讲义专著系列51 238–259。IMS,俄亥俄州比奇伍德·Zbl 1124.60030号
[19] Hein,M.、Audibert,J.-Y.和von Luxburg,U.(2005年)。从图到流形——图Laplacians的弱和强点态一致性。学习理论。计算机科学课堂讲稿3559 470-485。柏林施普林格·Zbl 1095.68097号
[20] Johnstone,I.M.(2006)。高维统计推断和随机矩阵。可从arXiv:math/0611589v1获取。
[21] Moore,D.S.和Yackel,J.W.(1977年)。最近邻密度函数估计量的一致性。《统计年鉴》第5卷第143-154页·Zbl 0358.60053号 ·doi:10.1214/aos/1176343747
[22] Roweis,S.T.和Saul,L.K.(2000)。局部线性嵌入的非线性降维。科学290 2323–2326。
[23] Singer,A.(2006年)。从图到流形Laplacian:收敛速度。申请。计算。哈蒙。分析21 128–134·Zbl 1095.68102号 ·doi:10.1016/j.acha.2006.03.004
[24] Singer,A.和Wu,H.-T.(2012年)。矢量扩散图和拉普拉斯联系。普通纯应用程序。数学65 1067–1144·Zbl 1320.68146号 ·doi:10.1002/cpa.21395
[25] Singer,A.和Wu,H.-T.(2013)。从未知随机方向的噪声投影进行二维层析成像。SIAM J.成像科学6 136–175·Zbl 1279.68339号 ·doi:10.1137/090764657
[26] Singer,A.和Wu,H.-T.(2017)。随机样本连接拉普拉斯算子的谱收敛性。信息推断6 58–123·Zbl 1386.94055号
[27] Smolyanov,O.、Weizsacker,H.诉和Wittich,O.(2007年)。Chernoff定理和流形上布朗运动的离散时间近似。潜在分析26 1-29·Zbl 1107.58014号 ·数字对象标识码:10.1007/s11118-006-9019-z
[28] Stein,E.M.和Weiss,G.(2016)。欧氏空间上的傅里叶分析简介。PMS32.普林斯顿大学出版社,新泽西州普林斯顿·Zbl 0232.42007号
[29] Tenenbaum,J.B.、de Silva,V.和Langford,J.C.(2000)。非线性降维的全局几何框架。科学290 2319–2323。
[30] van der Maaten,L.和Hinton,G.(2008)。使用t-SNE可视化数据。J.马赫。学习。第9 2579–2605号决议·兹比尔1225.68219
[31] von Luxburg,U.、Belkin,M.和Bousquet,O.(2008)。光谱聚类的一致性。Ann.Statist.36 555–586·Zbl 1133.62045号 ·doi:10.1214/009053607000000640
[32] Wang,X.(2015)。图Laplacian的谱收敛速度。可从arXiv:1510.08110获取。
[33] Weinberger,K.Q.和Saul,L.K.(2006)。介绍了利用最大方差展开进行非线性降维。在AAAI 1683-1686年。
[34] Wu,H.-T.和Wu,N.(2018)。补充“在流形设置下全局思考,局部拟合:局部线性嵌入的渐近分析”。DOI:10.1214/17-AOS1676SUPP。
[35] Zhang,J.和Wang,J.(2006)。MLLE:使用多个权重修改局部线性嵌入。神经信息处理系统进展19(NIPS 2006)1593-1600。麻省理工学院出版社,马萨诸塞州剑桥。
[36] Zhang,Z.和Zha,H·Zbl 1077.65042号 ·doi:10.1137/S1064827502419154
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。