一类用于持久图快速比较的拓扑伪距离

作者

  • 罗兰多·金德兰·努涅斯 智利大学
  • 米尔恰·彼得拉奇 加州大学智利分校
  • 毛里西奥·塞尔达 智利大学
  • 南希·希施费尔德 智利大学

内政部:

https://doi.org/10.1609/aaai.v38i12.29220

关键词:

ML:评估与分析,DMKM:数据挖掘与知识管理的其他基础,ML:分类与回归,ML:聚类,ML:核心方法,ML:透明、可解释、可解释的ML

摘要

持久性图(PD)在拓扑数据分析中发挥着重要作用,并被越来越多的应用程序所使用。PD数据的比较需要计算大组PD之间的距离,使用准确、理论上可靠且计算速度快的度量。尤其是对于密度更高的多维PD,缺乏此类比较指标。一方面,Wasserstein型距离具有较高的精度和理论保证,但会产生较高的计算成本。另一方面,矢量化之间的距离(如持久性统计(PS))具有较低的计算成本,但缺乏PD空间上真实距离的准确性保证和理论性质。在这项工作中,我们引入了一类称为扩展拓扑伪距离(ETD)的伪距离,它具有可调的复杂度,可以在高复杂度极限下近似切片和经典Wasserstein距离,而在低复杂度极限上计算量较小,接近持久性统计,从而允许用户在两个指标之间进行插值。我们进行了理论比较,以说明如何在持久性矢量化和Wasserstein距离之间的中间水平上拟合我们的新距离。我们还通过实验验证了ETD在准确性方面优于PS,在计算复杂度方面优于Wasserstein距离和Sliced Wassersstein距离。

出版

2024-03-24

如何引用

Kindelan Nuñez,R.、Petrache,M.、Cerda,M.和Hitschfeld,N.(2024)。一类用于持久图快速比较的拓扑伪距离。AAAI人工智能会议记录,38(12), 13202-13210. https://doi.org/10.1609/aaai.v38i12.29220

问题

章节

AAAI机器学习技术跟踪III