×

具有持久性指示器功能的拓扑机器学习。 (英语) Zbl 1465.68230号

Carr,Hamish(编辑)等人,数据分析和可视化中的拓扑方法V.理论、算法和应用。根据2017年2月27日至28日在日本东京举行的TopoInVis研讨会上的演示文稿选出的论文。查姆:斯普林格。数学。视觉。,87-101 (2020).
概要:来自计算拓扑的技术,特别是持久同源性,正日益与数据分析相关。它们的稳定指标允许使用许多基于距离的数据分析方法,例如多维缩放,同时提供了坚实的理论基础。然而,许多现代机器学习算法都是基于内核的。本文提出了持久性指示函数(PIF),它总结了拓扑数据分析中的持久性图,即特征描述符。PIF可以在线性时间内进行计算和比较,并且具有许多有益的特性,例如基于核的相似性度量的可用性。我们演示了它们在常见数据分析场景中的使用,例如复杂结构数据的置信集估计和分类。
关于整个系列,请参见[Zbl 1453.68012号].

MSC公司:

68T05型 人工智能中的学习和自适应系统
55N31号 持久同源性及其应用,拓扑数据分析
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Adams,H.、Emerson,T.、Kirby,M.、Neville,R.、Peterson,C.、Shipman,P.、Chepushtanova,S.、Hanson,E.、Motta,F.、Ziegelmeier,L.:持久性图像:持久性同源性的稳定向量表示。J.马赫。学习。第18(8)号决议,1-35(2017)·Zbl 1431.68105号
[2] Agarwal,P.K.,Edelsbrunner,H.,Harer,J.,Wang,Y.:2倍褶皱上的极端高程。光盘。计算。地理。36(4),553-572(2006)·Zbl 1105.52010号 ·doi:10.1007/s00454-006-1265-8
[3] Bobrowski,O.,Kahle,M.:随机几何复合体的拓扑:一项调查(2014年)。https://arxiv.org/abs/1409.4734 ·Zbl 1402.60015号
[4] Bremer,P.T.,Edelsbrunner,H.,Hamann,B.,Pascucci,V.:三角曲面上函数的拓扑层次。IEEE传输。视觉。计算。图表。10(4), 385-396 (2004). https://doi.org/10.1109/TVCG.2004.3 ·doi:10.1109/TVCG.2004.3
[5] Bubenik,P.:使用持久性景观进行统计拓扑数据分析。J.马赫。学习。第16号决议,77-102(2015年)·Zbl 1337.68221号
[6] Chazal,F.、Fasy,B.T.、Lecci,F.,Rinaldo,A.、Singh,A.、Wasserman,L.:关于持久性图表和景观的引导。模型。分析。信息系统。20(6), 111-120 (2013) ·doi:10.18255/1818-1015-2013-6-111-120
[7] Cohen-Steiner,D.,Edelsbrunner,H.,Harer,J.:持久性图的稳定性。离散。计算。地理。37(1), 103-120 (2007) ·Zbl 1117.54027号 ·doi:10.1007/s00454-006-1276-5
[8] Cohen-Steiner,D.,Edelsbrunner,H.,Harer,J.,Mileyko,Y.:Lipschitz函数具有p稳定持久性。已找到。计算。数学。10(2), 127-139 (2010) ·Zbl 1192.55007号 ·doi:10.1007/s10208-010-9060-6
[9] Edelsbrunner,H.,Harer,J.:计算拓扑:导论。AMS,纽约(2010)·Zbl 1193.55001号
[10] Edelsbrunner,H.,Morozov,D.:持久同源性:理论与实践。摘自:欧洲数学大会。EMS出版社,苏黎世(2014)
[11] Edelsbrunner,H.,Letscher,D.,Zomordian,A.J.:拓扑持久性和简化。离散。计算。地理。28(4), 511-533 (2002) ·Zbl 1011.68152号 ·doi:10.1007/s00454-002-2885-2
[12] Efron,B.,Tibshirani,R.J.:Bootstrap简介。统计学和应用概率专著,第57卷。查普曼和霍尔/CRC,佛罗里达州博卡拉顿(1993)·Zbl 0835.62038号
[13] Günther,D.,Boto,R.A.,Contreras-Garcia,J.,Piquemal,J.P.,Tierny,J.:表征化学系统中的分子相互作用。IEEE传输。视觉。公司。图表。20(12), 2476-2485 (2014) ·doi:10.1109/TVCG.2014.2346403
[14] Kerber,M.,Morozov,D.,Nigmetov,A.:几何有助于比较持久性图。在:Goodrich,M.,Mitzenmacher,M.(编辑)第18届算法工程与实验研讨会论文集(ALENEX),第103-112页。宾夕法尼亚州费城SIAM(2016)·兹比尔1430.68376
[15] Kohavi,R.:精度估计和模型选择的交叉验证和引导研究。摘自:《国际JCAI会议录》,第2卷,第1137-1143页(1995年)
[16] Kosorok,M.R.:经验过程和半参数推断导论。施普林格,纽约州纽约市(2008年)·Zbl 1180.62137号 ·数字对象标识代码:10.1007/978-0-387-74978-5
[17] Laney,D.,Bremer,P.T.,Mascarenhas,A.,Miller,P.,Pascucci,V.:理解流体动力不稳定性中湍流混合层的结构。IEEE传输。视觉。计算。图表。12(5), 1053-1060 (2006) ·doi:10.1109/TVCG.2006.186
[18] Mucha,M.,Sankowski,P.:通过高斯消去的最大匹配。摘自:第45届IEEE计算机科学基础年会,第248-255页(2004)·Zbl 1111.05304号
[19] 佩德雷戈萨(Pedregosa,F.)、瓦罗佐(Varoqueux,G.)、格兰福特(Gramfort,A.)、米歇尔(Michel,V.)、提里昂(Thirion,B.)、格里塞尔(Grisel,O.)、布隆德尔(Blondel,M.)、普雷滕霍弗(Prettenhofer,P.)、韦斯(Weiss,R.)、杜堡(Dubourg,V.,范德普拉斯(Vanderplas,J.)、帕索斯(PassosScikit-learn:Python中的机器学习。J.马赫。学习。第12号决议,2825-2830(2011年)·Zbl 1280.68189号
[20] Reininghaus,J.,Huber,S.,Bauer,U.,Kwitt,R.:拓扑机器学习的稳定多尺度内核。摘自:IEEE计算机视觉和模式识别会议(CVPR),第4741-4748页。Curran Associates,Inc.,纽约州Red Hook(2015)
[21] 瑞克,B,莱特,H:我可以把你比作一个网络吗-可视化莎士比亚戏剧的拓扑结构。摘自:IEEE VIS数字人文可视化研讨会。马里兰州巴尔的摩(2016)
[22] Rieck,B.,Fugacci,U.,Lukasczyk,J.,Leitte,H.:集团社区持久性:复杂网络的拓扑可视化分析方法。IEEE传输。视觉。计算。图表。22(1), 822-831 (2018). https://doi.org/10.109/TVCG.2017.2744321 ·doi:10.1109/TVCG.2017.2744321
[23] Schölkopf,B.,Smola,A.J.:用内核学习。麻省理工学院出版社,马萨诸塞州剑桥(2002)·Zbl 1019.68094号
[24] Schölkopf,B.,Smola,A.J.,Müller,K.R.:作为核心特征值问题的非线性分量分析。神经计算。10(5), 1299-1319 (1998) ·doi:10.1162/08997669830017467
[25] Sugiyama,M.,Ghisu,M.E.,Llinares-López,F.,Borgwardt,K.:graphkernels:R和Python图形比较软件包。生物信息学34(3),530-532(2017)
[26] Turner,K.,Mileyko,Y.,Mukherjee,S.,Harer,J.:Fréchet表示持久性图的分布。离散。计算。地理。52(1), 44-70 (2014) ·Zbl 1296.68182号 ·doi:10.1007/s00454-014-9604-7
[27] Yanardag,P。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。