×

通过奇异值分解对大型图进行聚类。 (英语) Zbl 1089.68090号

摘要:我们考虑将(n)维欧氏空间中的一组(m)点划分为(k)个簇(通常(m)和(n)是可变的,而(k)是固定的)的问题,以最小化每个点与其簇中心之间的平方距离之和。这个公式通常是(k)-均值聚类算法的目标。我们证明了这个问题在NP-hard中即使在(k)=2时也是如此,并且我们考虑了这个离散问题的连续松弛:找到(k)维子空间(V),它使到(m)点的平方距离之和最小。这种松弛可以通过计算表示\(m\)点的\(m\乘以n\)矩阵\(A\)的奇异值分解(SVD)来解决;这个解可以用来得到原问题的2-近似算法。然后我们认为,事实上,松弛提供了一个广义聚类,它本身是有用的。
最后,我们证明了给定矩阵的随机子矩阵(根据适当的概率分布选择)的奇异值分解提供了整个矩阵奇异值分解的近似值,从而产生了一个非常快速的随机算法。我们希望此算法是本文的主要贡献,因为它可以应用于现代应用中通常出现的超大规模问题。

MSC公司:

68T05型 人工智能中的学习和自适应系统
68瓦20 随机算法
PDF格式BibTeX公司 XML格式引用
全文: 内政部