×

持久性曲线:总结持久性图的规范框架。 (英语) Zbl 1497.55008号

本文研究持久同调(PH)计算所得持久图的拓扑摘要。PH通过跟踪拓扑特征在某些变化参数上的变化来从数据集中提取拓扑信息;然后将这些信息存储为持久性图(PD)。然而,正如机器学习算法所要求的那样,PD空间不是希尔伯特空间。因此,研究人员提出了将PD映射到希尔伯特空间的各种方法,这一步骤被称为汇总PD,从而得到拓扑摘要。
总结PD有两种技术,即核函数和PD矢量化。本文选择后一种技术来提出一种统一的向量化PD框架,称为持久性曲线(PC)。一旦建立了个人电脑框架,作者将展示个人电脑如何适合现有的个人电脑摘要。为了清楚起见,作者通过PC展示了以下PD总结:寿命曲线、生命熵曲线、PD阈值、持久性景观、持久性轮廓和Euler特征曲线。在稳定性分析的背景下,构造了定理1,该定理可用于任何特定的PC,但持久性环境除外。利用该定理,对许多PC进行了稳定性分析,例如,寿命PC相对于Wasserstein距离(W_1)是条件稳定的,而在瓶颈距离(W_{infty})下是不稳定的。
为了获得稳定的持久性总结,作者提出了两种PC变体,称为归一化持久性曲线和基于熵的持久性曲线。以寿命PC为例,证明了归一化寿命PC在(W_1)下是稳定的,在(W{infty})下也是条件稳定的。这一发现引出了另一个问题:PC在正常化条件下会变得稳定吗?为了使PC在归一化后保持稳定,作者提出了三个条件,但需要注意的是,PC在归一前是有条件稳定的。以类似的方式,他们表明生命熵曲线相对于(W_1)和(W{infty})是条件稳定的。PC的Python实现在Github中很容易获得:https://github.com/azlawson/PersistenceCurves网站
接下来,作者使用两个应用程序讨论了所提出的PC的计算效率、效率和实验稳定性:离散动力系统的参数确定和图像纹理分类。此外,还比较了PC和其他TDA方法的随机森林分类结果。数值实验表明,稳定性和分类性能可能没有高度相关性。例如,与Betti曲线和持久性统计数据相比,持久性环境(已经证明是稳定的)表现不佳。在高斯噪声的影响下,持久性图像表现优于其他PC,而持久性统计则表现不佳。
在最后一节中,作者通过显示两个不同的图像来警告用户,这两个图像会产生相似的PD,这反过来又会导致相似的PC。此外,他们注意到要选择合适的矢量大小来保留输入的信息。他们还根据其性能、稳定性和计算效率,提出了用于实际应用的归一化寿命曲线。

MSC公司:

55N31号 持久同源性及其应用,拓扑数据分析
62R40型 拓扑数据分析
68T09号 数据分析和大数据的计算方面
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 持久性图像。https://gitlab.com/csu-tda/PersistenceImages(https://gitlab.com/csu-tda/PersistenceImages) (2019)
[2] Adams,H。;艾默生,T。;Kirby,M。;内维尔,R。;彼得森,C。;希普曼,P。;Chepushtanova,S。;Hanson,E。;莫塔·F。;Ziegelmeier,L.,《持久性图像:持久性同源性的稳定向量表示》,J.Mach。学习。决议,18,218-252(2017)·Zbl 1431.68105号
[3] Atienza,N。;Gonzalez Diaz,R。;Soriano-Trigueros,M.,用于拓扑数据分析的新的基于熵的汇总函数,电子。注释谨慎。数学。,68, 113-118 (2018) ·Zbl 1397.05208号 ·doi:10.1016/j.endm.2018.06.020
[4] Atienza,N.,González-Díaz,R.,Soriano-Trigueros,M.:关于持久熵的稳定性和TDA的新汇总函数。arXiv:1803.08304(2018)·Zbl 1397.05208号
[5] Bell,G.,Lawson,A.,Pritchard,C.N.,Yasaki,D.:持久性图的空间没有yu的属性A(2019)·Zbl 1483.54020号
[6] 本迪,P。;马龙,JS;米勒,E。;Pieloch,A。;Skwerer,S.,脑动脉树的持续同源性分析,Ann.Appl。统计,10198(2016)·doi:10.1214/15-AOAS886
[7] Berry,E。;陈,Y-C;西塞夫斯基-科赫,J。;Fasy,BT,持久性图的功能摘要,J.Appl。计算。白杨。,4, 211-262 (2020) ·Zbl 1452.62999号 ·doi:10.1007/s41468-020-00048-w
[8] Bubenik,P.,《使用持久性景观的统计拓扑数据分析》,J.Mach。学习。决议,16,77-102(2015)·兹比尔1337.68221
[9] 持久性环境及其一些属性。阿贝尔座谈会,97-117(2020)·兹比尔1453.62807
[10] Bubenik,P。;Vergili,T.,持久性模块的拓扑空间及其性质,J.Appl。计算。白杨。,2, 233-269 (2018) ·Zbl 1423.55012号 ·doi:10.1007/s41468-018-0022-4
[11] Bubenik,P.,Wagner,A.:将持久性图嵌入到hilbert空间(2019)·Zbl 1455.55006号
[12] Carrière,M.,Bauer,U.:关于将持久性图嵌入到可分hilbert空间的度量失真。In:计算几何研讨会(2019)·Zbl 07559221号
[13] Carrière,M.、Cuturi,M.和Oudot,S.:持久性图的切片Wasserstein内核。In:Precup,D.,Teh,Y.W.(eds.)《第34届国际机器学习会议论文集》,机器学习研究论文集第70卷,澳大利亚悉尼国际会议中心,8月6日至11日,PMLR,第664-673页(2017)
[14] Carrière,M.、Chazal,F.、Ike,Y.、Lacombe,T.、Royer,M.和Umeda,Y.:Perslay:持久性图和新图形拓扑签名的神经网络层(2019)
[15] Carstens,C.J.、Horadam,K.J.:协作网络的持久同源性。数学。问题。工程2013(2013)·Zbl 1299.91104号
[16] Chazal,F.、Fasy,B.、Lecci,F.,Michel,B.、Rinaldo,A.、Wasserman,L.:持久同源性的子采样方法。In:机器学习国际会议,pp 2143-2151(2015)
[17] Chazal,F.、Fasy,B.T.、Lecci,F.,Rinaldo,A.、Wasserman,L.:持久性景观和剪影的随机收敛。摘自:《第三十届计算几何年会论文集》,第474页。ACM(2014)·Zbl 1395.62187号
[18] Chen,Y.C.,Wang,D.,Rinaldo,A.,Wasserman,L.:持久性强度函数的统计分析。arXiv:1510.02502(2015)
[19] I.雪佛兰。;南达,V。;Oberhauser,H.,拓扑数据分析中的持久路径和签名特征,IEEE Trans。模式分析。机器。智力。,42, 192-202 (2020) ·doi:10.1109/TPAMI.2018.2885516
[20] Chung,Y.-M.,Day,S.:拓扑保真度和图像阈值:持久同源方法。数学杂志。成像视觉。第1-13页(2018年)·Zbl 1433.68510号
[21] Chung,Y.-M.,Hu,C.-S.,Lawson,A.,Smyth,C.:皮肤病图像分析的拓扑方法。收录于:2018 IEEE国际大数据会议(Big Data),第100-105页。IEEE(2018)
[22] 科恩·斯坦纳,D。;Edelsbrunner,H。;Harer,J.,持久性图的稳定性,离散。计算。地理。,37, 103-120 (2007) ·Zbl 1117.54027号 ·doi:10.1007/s00454-006-1276-5
[23] 科恩·斯坦纳,D。;Edelsbrunner,H。;Harer,J。;Mileyko,Y.,Lipschitz函数具有lp-稳定持久性,Found。计算。数学。,10, 127-139 (2010) ·Zbl 1192.55007号 ·doi:10.1007/s10208-010-9060-6
[24] 德席尔瓦,V。;Ghrist,R.,《通过持久同源性覆盖传感器网络》,代数几何。白杨。,7, 339-358 (2007) ·兹比尔1134.55003 ·doi:10.2140/agt.2007.7.339
[25] Divol,V.,Lacombe,T.:通过最佳部分传输理解持久性图空间的拓扑和几何。J.应用。计算。白杨。第1-53页(2020年)·Zbl 1473.62408号
[26] Dlotko,P.:持久性表示。收录于:GUDHI用户和参考手册,GUDHI编辑委员会3.1.1(2020)
[27] I.多纳托。;戈里,M。;佩蒂尼,M。;佩特里,G。;De Nigris,S。;Franzosi,R。;Vaccarino,F.,相变的持久同源性分析,Phys。E版,93,052138(2016)·doi:10.1103/PhysRevE.93.052138
[28] Edelsbrunner,H.,Harer,J.:《计算拓扑:导论》,杂项书籍,美国数学学会(2010)·Zbl 1193.55001号
[29] Edelsbrunner,H.,Letscher,D.,Zomordian,A.:拓扑持久性和简化。摘自:第41届计算机科学基础年会论文集,第454-463页。IEEE(2000)·Zbl 1011.68152号
[30] Feichtinger,HG;Strohmer,T.,Gabor分析与算法:理论与应用(2012),纽约:Springer科学与商业媒体,纽约·Zbl 0890.42004号
[31] Ferri,M.,Frosini,P.,Lovato,A.,Zambelli,C.:点选择:尺寸函数的新比较方案(应用于花押识别)。摘自:亚洲计算机视觉会议,第329-337页。斯普林格(1998)
[32] Frosini,P.:通过尺寸函数测量形状。领域:智能机器人与计算机视觉X:算法与技术。国际光学和光子学会,第1607卷,第122-134页(1992年)
[33] 郭伟。;马诺哈尔,K。;布鲁顿,SL;Banerjee,AG,Sparse-tda:多路分类拓扑数据分析的稀疏实现,IEEE Trans。知识。数据工程,30,1403-1408(2018)·doi:10.1010/TKDE.2018.2790386
[34] Hayman,E.、Caputo,B.、Fritz,M.、Eklundh,J.-O.:关于材料分类的现实条件的重要性。摘自:欧洲计算机视觉会议,第253-266页。斯普林格(2004)·Zbl 1098.68776号
[35] Hein,J.,《离散数学、离散数学和逻辑系列》(2003),波士顿:琼斯和巴特利特出版社,波士顿
[36] Kaczynski,T。;Mischaikow,K。;Mrozek,M.,计算同源性,应用数学科学(2004),纽约:Springer,纽约·Zbl 1039.55001号
[37] Kusano,G.,Hiraka,Y.,Fukumizu,K:用于拓扑数据分析的持久性加权高斯核。In:机器学习国际会议,pp 2004-2013(2016)
[38] Lawson,A.:PersistenceCurves(用于计算持久性曲线的python包)。https://github.com/azlawson/PersistenceCurves网站 (2018)
[39] Lawson,A.:《关于保护产品的粗糙特性和持久性曲线》,北卡罗来纳大学格林斯博罗分校博士论文(2019年)
[40] 拉泽布尼克,S。;施密德,C。;Ponce,J.,使用局部仿射区域的稀疏纹理表示,IEEE Trans。模式分析。机器。智力。,27, 1265-1278 (2005) ·doi:10.1109/TPAMI.2005.151
[41] Li,C.,Ovsjanikov,M.,Chazal,F.:基于持久性的结构识别。摘自:IEEE计算机视觉和模式识别会议记录,第1995-2002页(2014)
[42] 李,L。;Cheng,W-Y;Glicksberg,理学学士;戈特斯曼,O。;Tamler,R。;陈,R。;博廷格,EP;Dudley,JT,通过患者相似性拓扑分析识别2型糖尿病亚组,Sci。Transl.公司。医学,7311ra174-311ra174(2015)
[43] 刘,L。;陈,J。;费古斯,P。;赵,G。;切拉帕,R。;Pietikäinen,M.,《从弓到cnn:二十年来纹理分类的纹理表示》,国际计算机杂志。视觉。,127, 74-109 (2019) ·doi:10.1007/s11263-018-1125-z
[44] Mileyko,Y。;穆克吉,S。;Harer,J.,持久性图空间上的概率测度,逆概率。,27, 124007 (2011) ·Zbl 1247.68310号 ·doi:10.1088/0266-5611/27/1224007
[45] Nakamura,T。;Y.Hiraoka。;Hirata,A。;Escolar,EG公司;Nishiura,Y.,玻璃中中等范围有序的持久同源性和多体原子结构,纳米技术,26,304001(2015)·doi:10.1088/0957-4484/26/30/304001
[46] Ojala,T.,Maenpaa,T.,Pietikainen,M.,Viertola,J.,Kyllonen,J.,Huovinen,S.:纹理分析算法实证评估的Outex新框架。In:服务机器人用户交互支持的对象识别,第1卷,第701-706页。IEEE(2002)
[47] 佩德雷戈萨,F。;瓦罗佐,G。;Gramfort,A。;米歇尔,V。;蒂里昂,B。;格里塞尔,O。;布隆德尔,M。;普雷滕霍弗,P。;韦斯,R。;杜堡,V。;范德普拉斯,J。;帕索斯,A。;库纳波,D。;布鲁彻,M。;佩罗,M。;Duchesnay,E.,Scikit learn:Python中的机器学习,J.Mach。学习。第12号决议,2825-2830(2011年)·Zbl 1280.68189号
[48] 马萨诸塞州佩雷;Carlsson,G.,《用于纹理表示的基于klein-bottle的字典》,《国际计算杂志》。视觉。,107, 75-97 (2014) ·Zbl 1328.68279号 ·doi:10.1007/s11263-013-0676-2
[49] Reininghaus,J.,Huber,S.,Bauer,U.,Kwitt,R.:拓扑机器学习的稳定多尺度内核。摘自:IEEE计算机视觉和模式识别会议记录,第4741-4748页(2015)
[50] 理查德森,E。;Werman,M.,使用欧拉特征的有效分类,模式识别。莱特。,49, 99-106 (2014) ·doi:10.1016/j.patrec.2014.07.001
[51] Rieck,B.、Sadlo,F.、Leitte,H.:具有持久性指示器功能的拓扑机器学习。在:数据分析和可视化中的拓扑方法,第87-101页。施普林格(2017)·Zbl 1465.68230号
[52] Rotman,J.,《代数拓扑导论》,数学研究生教材(1998),纽约:Springer,纽约·Zbl 0661.55001号
[53] Saadatfar,M。;Takeuchi,H。;罗宾斯,V。;弗朗索瓦,N。;Hiraoka,Y.,《颗粒结晶的孔隙结构景观》,美国国家通讯社。,8, 15082 (2017) ·doi:10.1038/ncomms15082
[54] Tauzin,G.,Lupo,U.,Tunstall,L.,Pérez,J.B.,Caorsi,M.,Medina-Mardones,A.,Dassatti,A.,Hess,K.:giotto-tda:用于机器学习和数据探索的拓扑数据分析工具包(2020)·Zbl 07370556号
[55] 特拉利,C。;Saul,N。;Bar-On,R.,Ripser.py:python的精益持久同源库,J.开源软件。,925年3月(2018年)·doi:10.21105/joss.00925
[56] 特纳,K。;穆克吉,S。;Boyer,DM,造型形状和曲面的持久同源变换,Inf.Infer。《国际医学杂志》,第3310-344页(2014年)·Zbl 06840289号
[57] Turner,K.,Spreemann,G:相同但不同:拓扑摘要之间的距离相关性(2019)·Zbl 1450.62141号
[58] Umeda,Y.,《通过拓扑数据分析进行时间序列分类》,Inf.Media Technol,12,228-239(2017)
[59] Zomordian,A。;Carlsson,G.,计算持久同源性,离散。计算。地理。,33, 249-274 (2005) ·Zbl 1069.55003号 ·doi:10.1007/s00454-004-1146-y
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。