统计嵌入:超越主成分

@第{Tjstheim2021条统计EB,title={统计嵌入:超越主成分},author={Dag Tj{o}theim和Martin Jullum以及Anders L{o}land},期刊={ArXiv},年份={2021},体积={abs/2106.01858},url={https://api.semanticscholar.org/CorpusID:235313581}}
本文综述了数据科学和机器学习中嵌入超高维非线性数据结构的活动,重点介绍了拓扑嵌入方法,特别是将拓扑属性映射到持久性图和Mapper算法中。

本文中的数字

时间序列和动态网络嵌入的一些最新趋势

本文回顾了时间序列和动态网络嵌入的一些最新发展,强调了静态和动态情况之间的差异,并指出了动态情况下的几个开放问题。

使用t-SNE可视化数据

一种称为t-SNE的新技术,通过在二维或三维地图中为每个数据点提供一个位置来可视化高维数据,这是一种更容易优化的随机邻域嵌入的变体,并且通过减少将点聚集在地图中心的趋势来产生显著更好的可视化效果。

非线性降维的全局几何框架。

一种解决降维问题的方法,它使用易于测量的局部度量信息来学习数据集的潜在全局几何结构,并有效地计算出全局最优解,并保证渐近收敛到真实结构。

局部线性嵌入的非线性降维。

引入了局部线性嵌入(LLE),这是一种无监督学习算法,用于计算高维输入的低维邻域保持嵌入,从而学习非线性流形的全局结构。

LINE:大规模信息网络嵌入

一种称为“LINE”的新型网络嵌入方法,适用于任意类型的信息网络:无向、有向和/或加权,并优化了精心设计的目标函数,该函数既保留了本地网络结构,也保留了全局网络结构。

大尺度高维数据可视化

提出了LargeVis技术,该技术首先从数据中构造一个精确近似的K最近邻图,然后在低维空间中布局该图,并容易缩放到数百万个高维数据点。

用于持久性图的切片Wasserstein内核

定义了一个新的PD核,它不仅是可证明稳定的,而且对于PD之间的第一个图距离也是有区别的(界限取决于PD中的点数)。

用于降维和数据表示的拉普拉斯特征映射

这项工作提出了一种用于表示高维数据的几何动机算法,该算法提供了一种计算效率高的非线性降维方法,该方法具有局部保持特性,并且与聚类有着天然的联系。

谱聚类与高维随机块模型

本文中的渐近结果是第一个允许模型中簇数随节点数增长的聚类结果,因此称为高维。

时间序列和动态网络嵌入的一些最新趋势

本文回顾了时间序列和动态网络嵌入的一些最新发展,强调了静态和动态情况之间的差异,并指出了动态情况下的几个开放问题。
...