mapper复合体中有趣的路径

作者

  • 阿南斯·卡利亚纳拉曼 华盛顿州立大学
  • Methun Kamruzzaman公司 华盛顿州立大学
  • 巴拉·克里希纳莫西 华盛顿州立大学 http://orcid.org/0000-0002-2727-6547

内政部:

https://doi.org/10.20382/jocg.v10i1a17

摘要

给定具有定义在点上的函数的高维数据点云,映射器算法以连接点的简单复数形式生成紧凑的摘要。此摘要提供了富有洞察力的数据可视化,这些可视化已用于应用程序中,以识别具有有趣属性的点子集,即子种群。这些子种群通常在mapper复合体中显示为长路径、耀斑(即分支路径)或循环。

我们研究在给定的映射复合体中量化子种群的兴趣度的问题。首先,我们使用映射复合体的1-骨架创建一个加权有向图G=(V,E)。我们使用目标函数(即因变量)的顶点(即簇)处的平均值来将边从低值引导到高值。我们将顶点(高-低)的平均值之间的差异设置为边的权重。剩余h函数(即自变量)的协变由分配给边缘的h位二进制签名捕获。G中一个有趣的路径是一个有向路径,其边都具有相同的特征。此外,我们将这种路径的兴趣度得分定义为其边权重之和乘以其相应秩的非线性函数,即沿路径的边的深度。这种非线性函数可以对因变量值的增长预计将集中在路径的特定间隔中的应用情况进行建模,例如,植物生长在季节后期加速,或绝症患者的健康状况在接近尾声时迅速恶化。

其次,我们研究了该图G上的三个优化问题,以量化感兴趣的子种群。在问题MaxIP中,目标是找到G中最有趣的路径,即兴趣度得分最大的有趣路径。对于G是一个有向无环图(DAG)的情况,这可能是许多应用中的典型设置,我们证明了MaxIP可以在多项式时间内求解,即在O(mnd_in)时间和O(mn)空间中,其中m、n和d_in分别是G中的边数、顶点数和顶点的最大支数。

在更一般的问题IP中,目标是找到一组边缘不相交的有趣路径,并使所有路径的兴趣度得分之和最大化。我们还研究了一种称为k-IP的IP变体,其目标是识别一组具有k条边的边不相交的有趣路径,并且所有路径的总兴趣度得分最大化。当k≤2时,k-IP可以在多项式时间内求解,我们证明,即使G是DAG,对于k≥3,k-IP也是NP-完全的。我们开发了DAG上IP和k-IP的启发式算法,使用DAG上MaxIP的算法作为子程序,并分别在IP和k-IP的O(mnd_in)和O(mkd_in)时间内运行。

下载

下载数据尚不可用。

作者传记

Ananth Kalyanaraman,华盛顿州立大学

信息科学技术学院

Methun Kamruzzaman,华盛顿州立大学

信息科学技术学院

巴拉·克里希纳莫西,华盛顿州立大学

数学与统计系

下载

出版

2019-11-25

问题

章节

文章