大比例尺

大比例尺:可视化大尺度和高维数据。我们研究在低维(通常是2D或3D)空间中可视化大规模和高维数据的问题。最近,许多成功的技术,首先计算数据点的相似结构,然后将它们投影到一个低维空间中,并保留其结构。这两个步骤的计算成本相当大,阻碍了诸如t-SNE这样的最新方法扩展到大规模和高维数据(例如,数百万个数据点和数百个维度)。我们提出了LargeVis,它首先从数据中构造一个精确近似的K-最近邻图,然后在低维空间中布局图。与t-SNE相比,LargeVis显著降低了图形构建步骤的计算成本,并采用了一种原则性的概率模型,通过具有线性时间复杂度的异步随机梯度下降,可以有效地优化目标。因此,整个过程很容易扩展到数百万个高维数据点。在实际数据集上的实验结果表明,LargeVis在效率和有效性方面都优于现有的方法。LargeVis的超参数在不同的数据集上也更加稳定。


zbMATH中的参考文献(参考 2篇文章 引用)

显示结果1到2,共2个。
按年份排序(引用)

  1. Leland McInnes,John Healy,James Melville:UMAP:用于降维的统一流形逼近和投影(2018)阿尔十四
  2. Rachkovskij,D.A.:用于快速相似性搜索的索引结构。二(2018)