A Class of Topological Pseudodistances for Fast Comparison of Persistence Diagrams

Rolando Kindelan Nuñez; Mircea Petrache; Mauricio Cerda; Nancy Hitschfeld

doi:10.1609/aaai.v38i12.29220

作者

罗兰多·金德兰·努涅斯智利大学
米尔恰·彼得拉奇加州大学智利分校
毛里西奥·塞尔达智利大学
南希·希施费尔德智利大学

内政部：

https://doi.org/10.1609/aaai.v38i12.29220

关键词：

ML:评估与分析，DMKM:数据挖掘与知识管理的其他基础，ML:分类与回归，ML:聚类，ML:核心方法，ML:透明、可解释、可解释的ML

摘要

持久性图（PD）在拓扑数据分析中发挥着重要作用，并被越来越多的应用程序所使用。PD数据的比较需要计算大组PD之间的距离，使用准确、理论上可靠且计算速度快的度量。尤其是对于密度更高的多维PD，缺乏此类比较指标。一方面，Wasserstein型距离具有较高的精度和理论保证，但会产生较高的计算成本。另一方面，矢量化之间的距离（如持久性统计（PS））具有较低的计算成本，但缺乏PD空间上真实距离的准确性保证和理论性质。在这项工作中，我们引入了一类称为扩展拓扑伪距离（ETD）的伪距离，它具有可调的复杂度，可以在高复杂度极限下近似切片和经典Wasserstein距离，而在低复杂度极限上计算量较小，接近持久性统计，从而允许用户在两个指标之间进行插值。我们进行了理论比较，以说明如何在持久性矢量化和Wasserstein距离之间的中间水平上拟合我们的新距离。我们还通过实验验证了ETD在准确性方面优于PS，在计算复杂度方面优于Wasserstein距离和Sliced Wassersstein距离。

一类用于持久图快速比较的拓扑伪距离

作者

内政部：

关键词：

摘要

下载

出版

如何引用

问题

章节

问询处

开发人

订阅