×

流形上的高斯过程陆地标记。 (英语) Zbl 1499.60114号

摘要:作为一种改进生物形状分析的方法,我们提出了一种在高斯过程模型下通过顺序选择最大不确定性点来对黎曼流形采样的算法。在实验设计文献中,这种贪婪策略被认为是接近最优的,并且在我们的应用程序中,它在表示生物对象的几何形状方面似乎优于使用用户标记。在无噪声情况下,我们根据样本数和流形几何量建立了均方预测误差(MSPE)的上界,证明了我们提出的序列设计的MSPE衰减速度与任何序列或非序列优化设计可实现的预言率相当;据我们所知,这是这种顺序实验设计的第一个结果。关键是在偏微分方程(PDE)模型简化的背景下,将贪婪算法与约化基方法联系起来。我们预计这种方法将在其他研究领域找到更多应用。

MSC公司:

60G15年 高斯过程
62K05美元 最佳统计设计
65D18天 计算机图形学、图像分析和计算几何的数值方面
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Z.Allen-Zhu、Y.Li、A.Singh和Y.Wang,通过后悔最小化实现实验的近最优设计,《机器学习国际会议论文集》,2017年,第126-135页。
[2] Z.Allen-Zhu、Y.Li、A.Singh和Y.Wang,实验设计的近最优离散优化:遗憾最小化方法,预印本,https://arxiv.org/abs/1711.05174, 2017.
[3] P.Alliez、D.Cohen-Steiner、O.Devillers、B.Leívy和M.Desbrun,《各向异性多边形重网格》,ACM Trans。图表。,22(2003),第485-493页,https://doi.org/10.1145/882262.882296。
[4] n.aronszajn,再生核理论,Trans。阿默尔。数学。《社会学杂志》,68(1950),第337-404页·Zbl 0037.20701号
[5] M.Atiyah和P.Sutcliffe,点粒子的几何,Proc。R.Soc.伦敦。数学。物理学。工程科学。,458(2002),第1089-1115页·Zbl 1010.58015号
[6] A.Atkinson、A.Donev和R.Tobias,最佳实验设计,SAS,牛津统计。科学。序列号。34,牛津大学出版社,2007年·兹比尔1183.62129
[7] H.Avron和C.Boutsidis,矩阵和应用的快速子集选择,SIAM J.矩阵分析。申请。,34(2013),第1464-1499页,https://doi.org/10.1137/120867287。 ·Zbl 1425.65059号
[8] C.Beard,Teilhardina,摘自《国际灵长类学百科全书》,John Wiley&Sons出版社,2017年,第1369-1370页,https://doi.org/10.1002/9781119179313.wbprim0444。
[9] M.Belkin和P.Niyogi,用于降维和数据表示的拉普拉斯本征映射,神经计算。,15(2003),第1373-1396页,https://doi.org/10.1162/089976603321780317。 ·Zbl 1085.68119号
[10] M.Belkin和P.Niyogi,《迈向基于拉普拉斯的流形方法的理论基础》,摘自《学习理论》,斯普林格出版社,2005年,第486-500页·Zbl 1137.68521号
[11] P.Beírard、G.Besson和S.Gallot,通过热核嵌入黎曼流形,Geom。功能。分析。,4(1994),第373-398页,https://doi.org/10.1007/BF01896401。 ·Zbl 0806.53044号
[12] N.Berline、E.Getzler和M.Vergne,《热核和狄拉克算子》,施普林格出版社,2004年·Zbl 1037.58015号
[13] A.L.Bertozzi、X.Luo、A.M.Stuart和K.C.Zygalakis,《基于图形的高维数据分类中的不确定性量化》,SIAM/ASA J.不确定性量化,6(2018),第568-595页,https://doi.org/10.1137/17M1134214。 ·Zbl 1394.62083号
[14] P.Binev、A.Cohen、W.Dahmen、R.DeVore、G.Petrova和P.Wojtaszczyk,缩减基方法中贪婪算法的收敛速度,SIAM J.Math。分析。,43(2011),第1457-1472页,https://doi.org/10.1137/100795772。 ·Zbl 1229.65193号
[15] M.Bouhtou、S.Gaubert和G.Sagnol,最优实验设计的子模性和随机舍入技术,电子。注释离散数学。,36(2010年),第679-686页·Zbl 1237.93057号
[16] D.M.Boyer、Y.Lipman、E.St.Clair、J.Puente、B.A.Patel、T.Funkhouser、J.Jernvall和I.Daubechies,自动量化解剖表面几何相似性的算法,Proc。国家。阿卡德。科学。美国,108(2011),第18221-18226页,https://doi.org/10.1073/pnas.1112822108。
[17] A.Buffa、Y.Maday、A.T.Patera、C.Prud\rqhomme和G.Turinici,参数化约化基方法贪婪算法的先验收敛性,ESAIM数学。模型。数字。分析。,46(2012),第595-603页·Zbl 1272.65084号
[18] I.Castillo、G.Kerkyacharian和D.Picard,托马斯·贝叶斯的“行走流形”,普罗巴伯。理论相关领域,158(2014),第665-710页,https://doi.org/10.1007/s00440-013-0493-0。 ·Zbl 1285.62028号
[19] M.Černỳ和M.Hladiák,实验设计中C最优的两个复杂性结果,计算。最佳方案。申请。,51(2012),第1397-1408页·Zbl 1245.90052号
[20] K.Chaloner和I.Verdinelli,《贝叶斯实验设计:综述》,统计学家。科学。,10(1995年),第273-304页·Zbl 0955.62617号
[21] K.Chaudhuri、S.M.Kakade、P.Netrapalli和S.Sanghavi,最大似然估计的主动学习收敛率,《神经信息处理系统进展》,2015年,第1090-1098页。
[22] X.Cheng,A.Cloninger和R.R.Coifman,基于各向异性核的两样本统计,预印本,https://arxiv.org/abs/1709.05006, 2017.
[23] A.Çivril和M.Magdon-Ismail,关于矩阵的最大体积子矩阵的选择及相关问题,Theoret。计算。科学。,410(2009),第4801-4811页·Zbl 1181.15002号
[24] D.Cohen-Steiner和J.-M.Morvan,限制Delaunay三角剖分和正态循环,第19届计算几何年度研讨会论文集,ACM,2003年,第312-321页·兹比尔1422.65051
[25] D.A.Cohn、Z.Ghahramani和M.I.Jordan,《统计模型的主动学习》,《人工智能研究杂志》,第4期(1996年),第129-145页·Zbl 0900.68366号
[26] R.R.Coifman和S.Lafon,扩散图,应用。计算。哈蒙。分析。,21(2006),第5-30页,https://doi.org/10.1016/j.acha.2006.04.006。 ·Zbl 1095.68094号
[27] N.Cressie,空间数据统计,Wiley Ser。普罗巴伯。统计人员。,John Wiley&Sons,2015年·Zbl 1347.62005年
[28] N.Cristianini和J.Shawe-Taylor,《支持向量机和其他基于内核的学习方法简介》,剑桥大学出版社,2000年·Zbl 0994.68074号
[29] L.Cuel、J.-O.Lachaud、Q.Meírigot和B.Thibert,使用广义Voronoi协方差测度进行稳健几何估计,SIAM J.Imaging Sci。,8(2015),第1293-1314页,https://doi.org/10.1137/10977552。 ·Zbl 1325.65032号
[30] V.De Silva和J.B.Tenenbaum,《使用标志点的稀疏多维标度》,技术报告,斯坦福大学,2004年。
[31] R.DeVore,G.Petrova,和P.Wojtaszczyk,Banach空间中约简基的Greedy算法,构造。约,37(2013),第455-466页·Zbl 1276.41021号
[32] P.Dhillon、Y.Lu、D.P.Foster和L.Ungar,快速最小二乘回归的新子抽样算法,《神经信息处理系统进展》,2013年,第360-368页。
[33] I.L.Dryden和K.V.Mardia,《统计形状分析》,John Wiley&Sons出版社,1998年·Zbl 0901.62072号
[34] V.Fedorov,《最佳实验理论》,俄文翻译,W.J.Studden和E.M.Klimko,Probab编辑。数学。统计师。12,学术出版社,1972年。
[35] T.E.Fricker、J.E.Oakley和N.M.Urban,《具有不可分离协方差结构的多元高斯过程模拟器》,《技术计量学》,55(2013),第47-56页。
[36] E.Fuselier和G.B.Wright,有限正定核嵌入子流形上的散射数据插值:Sobolev误差估计,SIAM J.Numer。分析。,50(2012),第1753-1776页,https://doi.org/10.1137/10821846。 ·Zbl 1251.41004号
[37] T.Gao、S.Z.Kovalsky、D.M.Boyer和I.Daubechies,三维几何形态计量学的高斯过程标记,SIAM J.Math。数据科学。,1(2019年),第237-267页,https://doi.org/10.1137/18M1203481。 ·Zbl 1499.60113号
[38] T.F.Gonzalez,最小化最大簇间距离的聚类,Theoret。计算。科学。,38(1985),第293-306页·Zbl 0567.62048号
[39] J.C.Gower,《广义生殖分析》,《心理测量学》,40(1975),第33-51页,https://doi.org/10.1007/BF02291478。 ·Zbl 0305.62038号
[40] J.C.Gower和G.B.Dijksterhuis,《Procrustes问题》,牛津统计师。科学。序列号。3,牛津大学出版社,2004年·Zbl 1057.62044号
[41] H.Harbrecht、M.Peters和R.Schneider,关于枢轴Cholesky分解的低秩近似,Appl。数字。数学。,62(2012),第428-440页,https://doi.org/10.1016/j.apnum.2011.10.001。 ·Zbl 1244.65042号
[42] D.Hardin和E.Saff,可校正D维流形的最小Riesz能量点配置,数学高级。,193(2005),第174-204页·Zbl 1192.49048号
[43] N.J.Higham,《数值算法的准确性和稳定性》,第二版,SIAM,2002年,https://doi.org/10.1137/1.9780898718027。 ·Zbl 1011.65010号
[44] P.W.Jones,M.Maggioni和R.Schul,拉普拉斯和热核特征函数流形参数化,Proc。国家。阿卡德。科学。美国,105(2008),第1803-1808页,https://doi.org/10.1073/pnas.0710175104。 ·Zbl 1215.58012号
[45] A.Kapoor、K.Grauman、R.Urtasun和T.Darrell,用高斯过程进行主动学习以进行对象分类,《IEEE第十一届计算机视觉国际会议论文集》,IEEE,2007年,第1-8页。
[46] L.Karp和M.Pinsky,子流形中一个外部小球的体积,Bull。伦敦数学。Soc.,21(1989),第87-92页·Zbl 0641.53007号
[47] A.Krause、A.Singh和C.Guestrin,《高斯过程中的近最优传感器布置:理论、高效算法和实证研究》,J.Mach。学习。Res.,9(2008),第235-284页·Zbl 1225.68192号
[48] D.D.Lewis和W.A.Gale,训练文本分类器的序列算法,《第17届国际ACM SIGIR信息检索研究与开发会议论文集》,Springer-Verlag,1994年,第3-12页。
[49] D.Liang和J.Paisley,高斯过程的Landmarking流形,第32届机器学习国际会议论文集,第37卷,JMLR.org,2015年,第466-474页。
[50] L.Lin、M.Niu、P.Cheung和D.Dunson,流形上回归和分类的外部高斯过程,预印本,https://arxiv.org/abs/1706.08757, 2017. ·Zbl 1421.62075号
[51] A.W.Long和A.L.Ferguson,Landmark diffusion maps(L-dMaps):样本外加速流形学习扩展,应用。计算。哈蒙。分析。,2017年8月31日在线发布,https://doi.org/10.1016/j.acha.2017.08.004。 ·Zbl 1489.68228号
[52] G.G.Lorentz、M.von Golitschek和Y.Makovoz,《构造逼近:高级问题》,格兰德伦数学。威斯。304,施普林格,柏林,1996年·Zbl 0910.41001号
[53] A.Mart\inez-Finkelshtein、V.Maymeskul、E.Rakhmanov和E.Saff,《(R^d)曲线上最小离散Riesz能量的渐近性》,加拿大。《数学杂志》,56(2004),第529-552页·Zbl 1073.31007号
[54] C.Moening和N.A.Dodgeson,《快速行进最远点采样》,技术报告,剑桥大学计算机实验室,2003年。
[55] M.Mohri、A.Rostamizadeh和A.Talwalkar,《机器学习基础》,麻省理工学院出版社,2012年·Zbl 1318.68003号
[56] S.Molnar,《关于克里金方法的收敛性》,科学安大。布达佩斯。第节。计算。,6(1985年),第81-90页·Zbl 0634.62105号
[57] F.J.Narcowich、J.D.Ward和H.Wendland,Sobolev误差估计和Bernstein不等式,通过径向基函数插值离散数据,构造。约,24(2006),第175-186页·Zbl 1120.41022号
[58] A.Nikolov,最大单纯形问题的随机四舍五入,载于第47届ACM计算理论研讨会论文集,ACM,2015年,第861-870页·Zbl 1321.68319号
[59] S.Niranjan、A.Krause、S.M.Kakade和M.Seeger,《强盗背景下的高斯过程优化:无遗憾和实验设计》,《第27届机器学习国际会议论文集》,Omnipress,2010年,第1015-1022页。
[60] J.E.Oakley和A.O'Hagan,《复杂模型的概率敏感性分析:贝叶斯方法》,J.R.Statist。Soc.序列号。B统计师。Methodol.方法。,66(2004),第751-769页·Zbl 1046.62027号
[61] A.C.Oöztireli、M.Alexa和M.Gross,《歧管的光谱采样》,ACM Trans。图形(TOG),29(2010),168。
[62] F.Pukelsheim,实验的优化设计,经典应用。数学。50,SIAM,2006年,https://doi.org/10.1137/1.9780898719109。 ·Zbl 1101.62063号
[63] C.E.Rasmussen和C.K.I.Williams,机器学习的高斯过程,自适应。计算。机器。学习。,麻省理工学院出版社,2006年·Zbl 1177.68165号
[64] M.Reed和B.Simon,《现代数学物理方法》。第一卷,功能分析,学术出版社,1980年·Zbl 0459.46001号
[65] K.Ritter,数值问题的平均案例分析,Springer,2007年·Zbl 0949.65146号
[66] E.Rodolaí、A.Albarelli、D.Cremers和A.Torsello,《简单有效的基于相关性的三维形状点采样》,《模式识别快报》。,59(2015),第41-47页,https://doi.org/10.1016/j.patrec.2015.03.009。
[67] L.Rosasco、M.Belkin和E.D.Vito,《关于积分算子的学习》,J.Mach。学习。Res.,11(2010),第905-934页·Zbl 1242.62059号
[68] S.Rosenberg,《黎曼流形上的拉普拉斯算子:流形分析导论》,伦敦数学。《社会学研究》第31卷,剑桥大学出版社,1997年·Zbl 0868.58074号
[69] R.B.Rusu和S.Cousins,3D在这里:点云库(PCL),IEEE机器人与自动化国际会议(ICRA)论文集,IEEE,2011年。
[70] J.Sacks、S.B.Schiller和W.J.Welch,《计算机实验设计》,《技术计量学》,31(1989),第41-47页。
[71] A.Saltelli和S.Tarantola,《关于数学模型中输入因素的相对重要性:核废物处置的安全评估》,J.Amer。统计师。协会,97(2002),第702-709页·Zbl 1073.62602号
[72] T.J.Santner、B.J.Williams和W.I.Notz,《计算机实验的设计与分析》,施普林格。统计人员。,施普林格科学+商业媒体,2013·Zbl 1405.62110号
[73] B.Scholkopf和A.J.Smola,《使用内核学习:支持向量机、正则化、优化及其他》,麻省理工出版社,2001年。
[74] B.Settles,《积极学习文献调查》,技术报告1648,计算机科学,威斯康星大学麦迪逊分校,2010年,http://burrsettles.com/pub/settles.activelearning.pdf。
[75] M.T.Silcox,Plesiadapiform,摘自《国际灵长类百科全书》,John Wiley&Sons出版社,2017年,第999-1000页,https://doi.org/10.1002/9781119179313.wbprim0038。
[76] A.Singer,从图到流形Laplacian:收敛速度,应用。计算。哈蒙。分析。,21(2006),第128-134页·Zbl 1095.68102号
[77] A.Singer和H.-T.Wu,向量扩散图和连接拉普拉斯,Comm.Pure Appl。数学。,65(2012),第1067-1144页,https://doi.org/10.1002/cpa.21395。 ·兹比尔1320.68146
[78] K.Smith,《关于观测到的多项式函数及其常数的调整值和插值的标准偏差及其对观测分布的正确选择的指导》,Biometrika,12(1918),第1-85页。
[79] M.L.Stein,《空间数据插值:克里格的一些理论》,施普林格科学与商业媒体出版社,2012年。
[80] L.N.Trefethen和D.Bau III,《数值线性代数》,SIAM,费城,1997年·Zbl 0874.65013号
[81] A.B.Tsybakov,《非参数估计导论》,施普林格出版社,2008年·Zbl 1176.62032号
[82] A.W.van der Vaart和J.H.van Zanten,再现高斯先验的核Hilbert空间,摘自《推动当代统计的极限:为纪念Jayanta K.Ghosh的贡献》,数理统计研究所,2008年,第200-222页·Zbl 1159.62004号
[83] C.Wachinger和P.Golland,可扩展流形学习的行列式点过程的多样性地标采样,预印本,https://arxiv.org/abs/1503.03506, 2015.
[84] S.Wang和Z.Zhang,通过自适应采样改进CUR矩阵分解和Nystro­m近似,J.Mach。学习。Res.,14(2013),第2729-2769页·Zbl 1318.65023号
[85] 王文华,屠瑞华,吴昌芳,克里金的普适收敛性,预印本,https://arxiv.org/abs/1710.06959v1, 2017.
[86] Y.Wang、A.W.Yu和A.Singh,《关于测量约束回归模型中实验的可计算选择》,J.Mach。学习。第18号决议(2017年),第5238-5278页·Zbl 1444.62093号
[87] H.Wendland,分散数据近似,剑桥大学。申请。计算。数学。17,剑桥大学出版社,2004年·Zbl 1185.65022号
[88] 吴洪涛,利用连接拉普拉斯热核嵌入黎曼流形,数学高级。,304(2017),第1055-1079页·Zbl 1350.53054号
[89] Z.-M.Wu和R.Schaback,分散数据径向基函数插值的局部误差估计,IMA J.Numer。分析。,13(1993),第13-27页·Zbl 0762.41006号
[90] H.Xu、H.Zha、R.-C.Li和M.A.Davenport,《通过Gershgorin循环引导样本选择的主动流形学习》,载于《第二十九届AAAI人工智能会议论文集》,人工智能促进协会,2015年,第3108-3114页。
[91] 杨扬,邓生,贝叶斯流形回归,统计年鉴。,44(2016),第876-905页·Zbl 1341.62196号
[92] D.Ylvisaker,《随机场上的设计》,载于《统计设计和线性模型调查》(科罗拉多州立大学,科罗拉多州柯林斯堡,1973年),J.N.Srivastava主编,北霍兰德,1975年,第593-607页·Zbl 0325.62048号
[93] X.Zhu、J.Lafferty和Z.Ghahramani,使用高斯场和调和函数结合主动学习和半监督学习,《机器学习和数据挖掘中从标记数据到未标记数据的连续性ICML 2003研讨会论文集》,华盛顿特区,2003年,第58-65页,http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.5.5447。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。